Python数据挖掘之数据预处理

上传:jjyingyao 浏览: 29 推荐: 0 文件:PDF 大小:116.08KB 上传时间:2020-12-23 07:03:14 版权申诉
目录Python主要数据预处理函数1、interpolate2、unique3、isnull / notnull4、andom5、PCA Python主要数据预处理函数 在数据挖掘中,海量的原始数据中存在着大量不完整(有缺失值)、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据清洗就显得尤为重要,数据清洗完成后接着进行或者同时进行数据集成、转换、规约等一系列的处理,该过程就是数据预处理。数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。统计发现,在数据挖掘的过程中,数据预处理工作量占到了整个过程的60%。 ​
上传资源
用户评论