2
Gensim辞書をディスクに保存しました。ロードすると、id2token
属性dictが設定されません。Gensimに保存されている辞書にid2tokenがありません
辞書を保存し、コードのシンプルな作品:私は(私はjupyterノートでそれをロードしています)、それをロードするとき
dictionary = corpora.Dictionary(tag_docs)
dictionary.save("tag_dictionary_lda.pkl")
は今、それはまだIDへのマッピングトークンの罰金に動作しますが、 id2token
は機能しません(私はIDをトークンにマップすることはできません)、実際にはid2token
に値が設定されていません。
> dictionary = corpora.Dictionary.load("../data/tag_dictionary_lda.pkl")
> dictionary.token2id["love"]
Out: 1613
> dictionary.doc2bow(["love"])
Out: [(1613, 1)]
> dictionary.id2token[1613]
Out:
---------------------------------------------------------------------------
KeyError Traceback (most recent call last)
<ipython-input> in <module>()
----> 1 dictionary.id2token[1613]
KeyError: 1613
> list(dictionary.id2token.keys())
Out: []
ありがとう、これは動作します。私はドキュメントで 'id2token'を見つけるのが難しかったです。たぶん私はgensimにプルリクエストを提出して、これを説明するドキュメントを追加するべきです。 – cjrieds
'' id2token [ix] ''の目的が何であるか知っていますか?期待されるトークンを返すことが保証されておらず、 '' dictionary [ix] ''もうまく動作します。 –
これにはいくつかの目的があると思いますが、手がかりはありません。あなたはgensimチームから誰かに直接質問しようとするかもしれません。 –