2
からトライグラム:Rは二生成し、私は各行の単語を含む列持つ列
word
-----
asdf
wer
asdf
最も頻繁二を取得する方法はありますし、すべての行の上にトライグラムを?バイグラムのための例えば :
aa: 10%
ab: 9%
.....
からトライグラム:Rは二生成し、私は各行の単語を含む列持つ列
word
-----
asdf
wer
asdf
最も頻繁二を取得する方法はありますし、すべての行の上にトライグラムを?バイグラムのための例えば :
aa: 10%
ab: 9%
.....
私はこの問題の特定の種の経験がないが、少し、Googleの作品は、「N-グラムベースのテキスト分類」のtau
パッケージを上げ。そして、あなたのサンプルにtextcnt
機能を使用すると、このように見えた:
x <- c('asdf','wer','asdf')
textcnt(x,3)
、あなたが探している情報の種類を返すようです。