私は638MBのRTCコーパスを3部用意しています(ソースドキュメント)。私は100ワードの単語の雲を取得しようとしたとき、それは12時間(まだ実行中)かかりました。これをより速くする方法はありますか?R Wordcloudが12時間以上かかる場合は、これをスピードアップすることができます
これは私のコマンドです.100ワードが必要です。
wordcloud(cleanFullCorpus, max.words = 100, random.order = FALSE, colors=brewer.pal(10,'Spectral'))
私は、ソースドキュメントのサブセットを避けることを望んでいましたが、必要に応じてできます。
トップ100ワードを抽出して単語クラウドを作成することは可能ですか?
これをもっと速くするための他のアイデアは高く評価されます。
ゲイリー PSそれは私のマシンは32ラムのギグ、10を使用し、約18%で
大量の再現性のあるサンプルデータセットを作成すると、より良い回答が得られます。 –