fork|fork from Datawhale 零基础入门数据挖掘-Task3 特征工程
【fork|fork from Datawhale 零基础入门数据挖掘-Task3 特征工程】参考
特征构造
文章图片
# 从邮编中提取城市信息,相当于加入了先验知识
data['city'] = data['regionCode'].apply(lambda x : str(x)[:-3])
data = https://www.it610.com/article/data
特征筛选
过滤式
# 相关性分析
print(data['power'].corr(data['price'], method='spearman'))
print(data['kilometer'].corr(data['price'], method='spearman'))
print(data['brand_amount'].corr(data['price'], method='spearman'))
print(data['brand_price_average'].corr(data['price'], method='spearman'))
print(data['brand_price_max'].corr(data['price'], method='spearman'))
print(data['brand_price_median'].corr(data['price'], method='spearman'))
包裹式
嵌入式
推荐阅读
- 使用协程爬取网页,计算网页数据大小
- 2019-08-16day20总结
- locust实例
- Docker|Docker exec 出现 "fork/exec /proc/self/exe: no such file or directory" 问题
- Fiddler实现手机抓包——小白入门
- 并发与高并发课程学习笔记(9)
- 唐诗英译|唐诗英译|| 杜甫《望岳》 Looking Out from Mont Taishan
- j集成学习
- 你被房东说过脏乱差吗()
- mongosql