特征预处理完之后,我们需要选择有意义的特征作为输入机器学习的算法和模型进行训练 在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称 PPMCC或PCCs)。用于衡量两个变量X和Y之间的线性相关相关关系,值域在-1与1之间。
详细内容 :
https://blog.csdn.net/qq_40260867/article/details/90667462
"""
给定数据集,返回数据集中每个特征和标签的相关系数"""import numpy as np
from sklearn.datasets import load_iris
iris=load_iris()result=[]
#使用numpy计算数据特征和标签的相关系数
for i in range(np.shape(iris.data)[1]):
pccs = np.corrcoef(iris.data[:,i], iris.target)
# print(pccs)
result.append(pccs[:,1][0])print(result)
# 对列表中的数都保留两位小数
result1=[]
for i in range(len(result)):
result1.append(round(result[i],3))print(result1)
【sklearn|Python三种方法计算皮尔逊相关系数以及实现给定数据集,返回数据集中每个特征和标签的相关系数】
推荐阅读
- python|python机器学习基础01——sklearn开启
- python|python机器学习基础05——sklearn之逻辑回归+分类评价指标
- 机器学习|分类问题性能评价指标详述
- 人工智能+大数据|特征工程(特征预处理(无量纲化处理))
- 人工智能+大数据|特征工程(特征提取入门学习(附案例))
- 机器学习实战|sklearn常用数据预处理方法
- sklearn|UCI Iris数据集K近邻方法建模预测鸢花种类
- 机器学习|机器学习基础教程笔记---特征工程
- Python机器学习基础与进阶|Python机器学习--集成学习算法--XGBoost算法