Spark mllib教程
作者: 时海
LabeledPoint
一个LabeledPoint是由一个稀疏/稠密本地向量关联一个标签构成的。LabeledPoint 用于监督学习算法。LabeledPoint的标签是一个double类型,可用于分类和回归。
对于二分类问题,标签值可以是0或1,对于多分类问题标签可以是0,1,2,3...
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.LabeledPoint

// Create a labeled point with a positive label and a dense feature vector.
val pos = LabeledPoint(1.0, Vectors.dense(1.0, 0.0, 3.0))

// Create a labeled point with a negative label and a sparse feature vector.
val neg = LabeledPoint(0.0, Vectors.sparse(3, Array(0, 2), Array(1.0, 3.0)))





标签: labeledpoint、vectors、标签、labeled、1.0
一个创业中的苦逼程序员
  • 回复
隐藏