Spark mllib教程
一个LabeledPoint是由一个稀疏/稠密本地向量关联一个标签构成的。LabeledPoint 用于监督学习算法。LabeledPoint的标签是一个double类型,可用于分类和回归。
对于二分类问题,标签值可以是0或1,对于多分类问题标签可以是0,1,2,3...
import org.apache.spark.mllib.linalg.Vectors import org.apache.spark.mllib.regression.LabeledPoint // Create a labeled point with a positive label and a dense feature vector. val pos = LabeledPoint(1.0, Vectors.dense(1.0, 0.0, 3.0)) // Create a labeled point with a negative label and a sparse feature vector. val neg = LabeledPoint(0.0, Vectors.sparse(3, Array(0, 2), Array(1.0, 3.0)))