参考:http://blog.csdn.net/xbmatrix/article/details/61624196
他们都是可以防止过拟合,降低模型复杂度
他们都是可以防止过拟合,降低模型复杂度
- L1是在loss function后面加上 模型参数的1范数(也就是|xi|)
- L2是在loss function后面加上 模型参数的2范数(也就是sigma(xi^2)),注意L2范数的定义是sqrt(sigma(xi^2)),在正则项上没有添加sqrt根号是为了更加容易优化
- L1 会产生稀疏的特征
- L2 会产生更多地特征但是都会接近于0
- L1会趋向于产生少量的特征,而其他的特征都是0,而L2会选择更多的特征,这些特征都会接近于0。L1在特征选择时候非常有用,而L2就只是一种规则化而已。
上一题:L1范式和L2范式的区别
标签: l2、l1、范数、xi、特征
笔试题
刷题
简历模板
AI算法
大数据
内推
内推: