零基础入门数据挖掘--二手车交易价格预测之一--特征工程 python3

1）基于baseline，模型用xgboost，得分709。
特征包括：'gearbox', 'power', 'kilometer', 'v_0', 'v_1', 'v_2', 'v_3', 'v_4', 'v_5', 'v_6', 'v_7', 'v_8', 'v_9', 'v_10', 'v_11', 'v_12', 'v_13', 'v_14'。
baseline的jupyter链接：https://tianchi.aliyun.com/notebook-ai/detail?postId=95422
2）按照阿泽老师发布的jupyter，做特征工程，模型用xgboost，得分是626。
特征包括：'bodyType', 'brand', 'fuelType', 'gearbox', 'kilometer', 'model',
'offerType', 'power', 'seller', 'v_0', 'v_1', 'v_10', 'v_11', 'v_12', 'v_13',
'v_14', 'v_2', 'v_3', 'v_4', 'v_5', 'v_6', 'v_7', 'v_8', 'v_9', 'used_time','city',
'brand_amount', 'brand_price_max', 'brand_price_median', 'brand_price_min', 'brand_price_sum',
'brand_price_std', 'brand_price_average', 'power_bin'

特征工程jupyter链接：https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.9.2c5266c2HRdfiO&postId=95501
3）在2）的基础上，将预测结果为负数的，设置为10，得分是626，变化不大。可能是因为这部分样本比较少。

4）接下来是要改进的思路，想从一下几个方面提升模型准确性
思路一：xgboost训练的时候，用的目标函数是R2，而比赛用的目标函数的MAE，xgboost允许自定义目标函数，但是要求目标函数二阶可导，MAE不满足二阶可导的条件。所以换支持MAE作为目标函数的模型，或者自定义接近MAE的二阶可导目标函数。
思路二：类别特征做one-hot编码。
【零基础入门数据挖掘--二手车交易价格预测之一--特征工程】思路三：对价格做log处理之后进行预测，预测结果再做指数变换。

零基础入门数据挖掘--二手车交易价格预测之一--特征工程

推荐阅读

降价|双11降价哪家强？iqoo：降900，三星：我降1300，荣耀：未知？

下厨房app菜单收藏方法

爱书签的孩子会有额外奖赏

金华个人所得税专项附加扣除指的是什么？

英语句法分析树

有哪些卖茶叶的天猫旗舰店值得推荐？

高仿尼康相机推荐高仿尼康相机

蛤蜊的营养功效

射手座女生喜欢什么样的礼物射手座女生漂亮吗

温州怎么查社保卡里有多少钱，怎么查社保余额

怎么用豆浆机打豆浆怎么用豆浆机打豆浆好喝

ps怎么给图像加影子详细教程

阳台种什么植物阳台种什么植物最旺风水

南极之恋是在南极拍的吗

vb.net设定为粗体 vb字体加粗代码后还原代码

快餐盒是什么材质的

孩子不阳光自信怎么办

榴莲,菠萝蜜,谁是你的最爱？

佳能35和50 佳能ef35与50

万答#13，MySQL自增键用完后，插入数据会发生什么情况