《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施

@[TOC]《零基础入门数据挖掘 - 二手车交易价格预测》baseline实施
《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施 前面陆陆续续学习机器学习大概有有2个月的时间,西瓜书没有看完,吴恩达的视频也没有看完。春节期间开始参加阿里巴巴智能运维算法大赛,和小伙伴一起通力合作,勉强进入复赛,感到力有不逮,基础不够牢固。前几天看到天池举行了《零基础入门数据挖掘 - 二手车交易价格预测》的比赛,并且出了官方Baseline。
初略的看了一遍Baseline,感觉写的非常好,数据分析EDA、特征工程、参数调整等等全部都有,并且出了官方教程,感觉就是一本零基础入门的宝书。
下面将我实施Baseline的过程写下来,供大家参考。
Fork Baseline Baseline的链接在这里
最新版本为V11。

  1. 点击右上角的“Fork”按钮,fork到自己的天池实验室空间;
    《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施
    文章图片
  2. 标题可以修改,你可以下载Notebook到本地运行。
    《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施
    文章图片
修改数据集 我试过使用天池的公共数据集,不稳定,会出现不能读取的问题。
上传数据到自己的个人空间。
  1. 在个人空间建子目录“zero”;
  2. 上传文件到目录“zero”
  3. 在Notebook里检查文件
    《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施
    文章图片
修改提交文件路径 将提交文件路径也设置到刚才新建的目录里。
《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施
文章图片

运行Baseline Notebook 这个Baseline写的很好,做了上面的配置后,就可以正常运行了。
  1. 运行Notebook;
    可以点击中间的按钮单步执行,也可以点击右面的按钮执行全部程序。
    《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施
    文章图片
  2. 下载提交文件
  3. 到比赛页面提交即可。
【《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施】Baseline在没有修改的情况下,成绩大概的680分。

    推荐阅读