数据挖掘面试题

上传:xu10420 浏览: 26 推荐: 0 文件:RAR 大小:39.55KB 上传时间:2019-05-15 17:20:20 版权申诉
一、异常值是指什么?请列举1种识别连续型变量异常值的方法?异常值(Outlier)是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。Grubbs’test(是以FrankE.Grubbs命名的),又叫maximumnormedresidualtest,是一种用于单变量数据集异常值识别的统计检测,它假定数据集来自正态分布的总体。
上传资源
用户评论