Rは二生成し、私は各行の単語を含む列持つ列

word 
----- 
asdf 
wer 
asdf

最も頻繁二を取得する方法はありますし、すべての行の上にトライグラムを？バイグラムのための例えば：

aa: 10% 
ab: 9% 
.....

2011-06-17 tom

私はこの問題の特定の種の経験がないが、少し、Googleの作品は、「N-グラムベースのテキスト分類」のtauパッケージを上げ。そして、あなたのサンプルにtextcnt機能を使用すると、このように見えた：

x <- c('asdf','wer','asdf') 
textcnt(x,3)

、あなたが探している情報の種類を返すようです。

2011-06-17 18:53:01 joran

答えて