pandas 中df 对象自带相关性计算方法corr() , 可以用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数、Kendall Tau相关系数和spearman秩相关)。
>>> import numpy as np
>>> import pandas as pd>>> df = pd.DataFrame({'A':np.random.randint(1, 100, 10),
'B':np.random.randint(1, 100, 10), 'C':np.random.randint(1, 100, 10)})>>> df A B C0 5 91 31 90 15 662 93 27 33 70 44 664 27 14 105 35 46 206 33 14 697 12 41 158 28 62 479 15 92 77>>> df.corr() # pearson相关系数 A B CA 1.000000 -0.560009 0.162105B -0.560009 1.000000 0.014687C 0.162105 0.014687 1.000000>>> df.corr('kendall') # Kendall Tau相关系数A B C
A 1.000000 -0.314627 0.113666B -0.314627 1.000000 0.045980C 0.113666 0.045980 1.000000>>> df.corr('spearman') # spearman秩相关A B C
A 1.000000 -0.419455 0.128051B -0.419455 1.000000 0.067279C 0.128051 0.067279 1.000000参考:https://blog.csdn.net/oh5w6hinug43jvrhhb/article/details/78389809