MLlibのword2vecをCBOWモードで実行するには？

私の理解では、word2vecは、2つのモードで実行することができるということである。MLlibのword2vecをCBOWモードで実行するには？

連続袋のワード（CBOW）（単語の順番は関係ありません）
連続スキップグラム（言葉の順序が重要）

私は、SparkのMLlibからCBOW実装を実行したいと思いますが、それはそれを行う方法を文書化し、その例から、私には明らかではありません。これはそのページに掲載されている例です。

から：https://spark.apache.org/docs/2.1.0/mllib-feature-extraction.html#example

import org.apache.spark.mllib.feature.{Word2Vec, Word2VecModel} 

val input = sc.textFile("data/mllib/sample_lda_data.txt").map(line => line.split(" ").toSeq) 

val word2vec = new Word2Vec() 

val model = word2vec.fit(input) 

val synonyms = model.findSynonyms("1", 5) 

for((synonym, cosineSimilarity) <- synonyms) { 
    println(s"$synonym $cosineSimilarity") 
}

私の質問：この例では使用しない2つのモードの

？
CBOWモードでモデルを実行する方法を知っていますか？

ありがとうございます！

出典

2017-09-26 magicalo

現在、MLlibのように見えるのは、スキップグラムだけです。

スキップグラムモデルのオープンチケット/プルリクエストは次のとおりです。https://issues.apache.org/jira/browse/SPARK-20372

出典

2017-09-28 15:35:23 magicalo

MLlibのword2vecをCBOWモードで実行するには？

答えて

関連する問題