1
私の理解では、word2vecは、2つのモードで実行することができるということである。MLlibのword2vecをCBOWモードで実行するには?
- 連続袋のワード(CBOW)(単語の順番は関係ありません)
- 連続スキップグラム(言葉の順序が重要)
私は、SparkのMLlibからCBOW実装を実行したいと思いますが、それはそれを行う方法を文書化し、その例から、私には明らかではありません。これはそのページに掲載されている例です。
から:https://spark.apache.org/docs/2.1.0/mllib-feature-extraction.html#example
import org.apache.spark.mllib.feature.{Word2Vec, Word2VecModel}
val input = sc.textFile("data/mllib/sample_lda_data.txt").map(line => line.split(" ").toSeq)
val word2vec = new Word2Vec()
val model = word2vec.fit(input)
val synonyms = model.findSynonyms("1", 5)
for((synonym, cosineSimilarity) <- synonyms) {
println(s"$synonym $cosineSimilarity")
}
私の質問:この例では使用しない2つのモードの
- ?
- CBOWモードでモデルを実行する方法を知っていますか?
ありがとうございます!