0
SparkML TF-IDFアルゴリズムを使用して、いくつかのFeature Vectorを取得しました。今私は "idfFeatures"の列にベクトルを取得したいと思います。DataFrameでVectorを取得する方法
私のコードは次のとおりです。
scala.MatchError: [(262144,[622,4200,7303,8501......,2.1972245773362196,1.2809338454620642])] (of class org.apache.spark.sql.catalyst.expressions.GenericRowWithSchema)
at scala.TFIDFTest2$$anonfun$1.apply(TFIDFTest2.scala:37)
:
Error:(38, 24) type Vector takes type parameters
case Row(vector: Vector) =>
^
私はStringにベクトルを変更する場合は、別のバグがあります:
val vectors = allDF.select("idfFeatures").map{
case Row(vector: Vector) =>
vector
}
vectors.foreach(println(_))
がコンソールにバグがあります
ベクターはどのように入手できますか?
は、私がスパーク2.0でそれを追加します。まだバグを印刷しています。ベクトル[A、[B]、[C]]を3列(columnA、columnB、columnC)に分割できますか? –
非常に便利です!なぜVectorをトップにインポートできないのですか? –
できます。しかし、上の部分は、ドキュメントのコピーされた例です。 –