为什么一些机器学习模型需要对数据进行归一化?
归一化化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。
  • 归一化后加快了梯度下降求最优解的速度。等高线变得显得圆滑,在梯度下降进行求解时能较快的收敛。如果不做归一化,梯度下降过程容易走之字,很难收敛甚至不能收敛。
  • 把有量纲表达式变为无量纲表达式, 有可能提高精度。一些分类器需要计算样本之间的距离(如欧氏距离),例如KNN。如果一个特征值域范围非常大,那么距离计算就主要取决于这个特征,从而与实际情况相悖(比如这时实际情况是值域范围小的特征更重要)。
  • 逻辑回归等模型先验假设数据服从正态分布。


参考:http://blog.csdn.net/xbmatrix/article/details/56695825


更多精选文章
标签: 归一化、收敛、梯度、值域、下降
一个创业中的苦逼程序员
笔试题


刷题


简历模板


AI算法


大数据


内推


推荐阅读:
阿里巴巴笔试面试大全
腾讯笔试面试大全
百度笔试面试大全
今日头条笔试面试大全
网易笔试面试大全
Google笔试面试大全
更多笔试面试大全
隐藏