我想对两个名义列做相关性分析,“拥护者”列和“公司”列,在这个例子中拥护者处理的是公司,数据看起来像这样
| 鼓吹|公司简介|
| --------------|--------------|
| Adv 1|比较例A|
| Adv 1|比较例A|
| Adv 2|比较例C|
| Adv 3|比较例B|
| Adv 3|比较例B|
| Adv 2|化合物D|
| Adv 3|比较例E|
| Adv 1|比较例A|
所以,我想做一个基于微积分的分析,来显示每一对中,倡导者X和公司Y之间是否有很强的相关性。
我试着使用克莱默的V方法,但我不能使它正常工作。
我想要实现的结果类似于倡导者与公司的相关矩阵。
感谢您的任何帮助!
1条答案
按热度按时间egmofgnx1#
以下是计算数据中“Advocate”和“Company”列的Cramer V统计量的Python代码:
请注意,虽然Cramer's V可以提供两个分类变量之间关联强度的度量,但它不提供有关该关联性质的任何信息。高值可能意味着强正关联、强负关联或更复杂的关联。要完全理解变量之间的关系,您需要更仔细地检查数据。
我希望这对你有帮助!