零基础入门数据挖掘 Task3 特征工程

上传:CailiaoTang 浏览: 8 推荐: 0 文件:PDF 大小:214.73KB 上传时间:2021-03-08 09:01:10 版权申诉
目录 1. 学习内容 2. 导入相关模块和数据 3. 判别异常值 3.1 什么是异常值 3.2 常见的异常值判别方法 3.2.1 简单统计分析 3.2.2 3σ原则 3.2.3 箱型图 3.3 异常值处理方法 3.4 异常值处理实现(箱型图+删除异常值) 4. 构造新特征并保存数据到文件 4.1 供树模型使用 4.1.1 合并训练集和测试集 4.1.2 新建“使用时间”特征 4.1.3 新建“城市信息”特征 4.1.4 新建“统计信息”特征(以品牌为例) 4.1.5 数据分桶(以马力为例) 4.1.6 删除原始特征 4.1.7 导出数据到文件 4.2 供线性模型使用 4.2.1 观察数据分布
上传资源
用户评论