0
Rのtm
パッケージにちょうど知り合いました。フォルダに別々の.txtファイルがある場合、これらをRの中のコーパスファイル に変換する方法を理解していますが、私の特定のケースでは、すべてのテキストデータが1つのファイルにあります。そのファイル内の各センテンスは1つのドキュメントを表し、先に フレーズIDとセンテンスIDを持っています。テキストデータを含むファイルをR tmのコーパス形式に変換する方法
PhraseId SentenceId 156061 8545アン断続的に楽しいが、ほとんど日常的努力: .TSVファイルには、次のようになります。 156062 8545アン断続的に楽しいが、ほとんどのルーチン努力156063 8545 156064 8545断続的に楽しいが、ほとんどのルーチン努力.....私は
tm
のコーパスフォーマットにそのようなファイルのうち、テキストデータを変換するにはどうすればよい
?