归一化:
将不同量纲的数据统一到同一数量级下。
数据归一化通俗的说是将大的数据变成小的数据,而不影响数据的分布或数据间关系。一般是将原始数据线性变换,使得结果值映射到[0,1]或者[-1,1]之间。
归一化的好处:
1、归一化后加快了梯度下降求最优解的速度。
梯度下降“小步慢走”,通过不断的迭代,求得最优解,归一化让特征向量中不同特征的取值相差不大,训练速度大大加快。
2、归一化有可能提高精度。
计算样本距离时,如果特征向量取值范围相差很大,不进行归一化处理,则值范围更大的特征向量对距离的影响更大,实际情况是,取值范围更小的特征向量对距离影响更大,这样的话,精度就会收到影响。
算法原理,是否需要归一化。
逻辑回归是用梯度下降求解。
归一化可以让模型快速迭代,达到最优解。