1. 缺失值较多.直接将该特征舍弃掉,否则可能反倒会带入较大的noise,对结果造成不良影响。
2. 缺失值较少,其余的特征缺失值都在10%以内,我们可以采取很多的方式来处理:
- 把NaN直接作为一个特征,假设用0表示;
- 用均值/众数填充;
- 用随机森林等算法预测填充。
上一题:归一化、标准化、正则化的区别
标签: 缺失、值较、填充、特征、不良影响
笔试题
刷题
简历模板
AI算法
大数据
内推
内推: