2017-05-04 6 views
0

Rのtmパッケージにちょうど知り合いました。フォルダに別々の.txtファイルがある場合、これらをRの中のコーパスファイル に変換する方法を理解していますが、私の特定のケースでは、すべてのテキストデータが1つのファイルにあります。そのファイル内の各センテンスは1つのドキュメントを表し、先に フレーズIDとセンテンスIDを持っています。テキストデータを含むファイルをR tmのコーパス形式に変換する方法

PhraseId SentenceId 156061 8545アン断続的に楽しいが、ほとんど日常的努力: .TSVファイルには、次のようになります。 156062 8545アン断続的に楽しいが、ほとんどのルーチン努力156063 8545 156064 8545断続的に楽しいが、ほとんどのルーチン努力.....私はtmのコーパスフォーマットにそのようなファイルのうち、テキストデータを変換するにはどうすればよい

答えて

0

試行:

library(tm) 

txt<-("PhraseId SentenceId 156061 8545 An intermittently pleasing but mostly routine effort . 156062 8545 An intermittently pleasing but mostly routine effort 156063 8545 An 156064 8545 intermittently pleasing but mostly routine effort ") 

text.corpus<-Corpus(VectorSource(txt)) 
関連する問題