跳转至

数据挖掘从入门到进阶

pandas教程

绝佳的开源实践课程: https://mp.weixin.qq.com/s/Em9gZehlYQ-SLp75AUre5g

冠军思路

https://mp.weixin.qq.com/s/TzFB0GmL10r3ZKDDkB8x_A

知识整理

该知识整理内容仅为**复盘知识整理**部分,详见知识整理,以下为零基础入门数据挖掘之二手车预测大赛笔记的文档,详细流程见@夏凡的gitee仓库

另外附上400分的大佬的notebook: https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.21.1cd866c2rkS6gt&postId=103212


本打卡笔记根据官方baseline修改而来,天池赛题链接:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281949.1003.3.493e593auHLYrb

笔记特点:

  • 详细的、整理过的全部流程
  • 使用nni搜索超参
  • 本流程LGB得分522
  • 相关知识点资料已经整理完毕

注意要点:

资料链接:

  1. 打卡活动中整理的资料 提取码:it09

PS:资料来源于datawhale官方和参加打卡的小伙伴的笔记分享等

TASK1

赛题理解

TASK2&3

EDA与特征工程

TASK4

建模调参

比较喜欢科学调参,所以就用NNI进行了超参搜索

  1. lgboost
  2. xgboost
  3. RandomForestRegression

TASK5

模型融合