問題: 私は、Webページからのダウンロードの文章はそのループがある - と反復ごとに成長している文字に追加しますベクター。アペンドtxtファイル - その後、TMパッケージでコーパスにそのtxtファイルを読み込む
は概念的には、出力は次のようになります。
myVec
[1] "bla"
[2] "blablabla"
[3] "blabla"
[4] " blablablablabla"
等...
各番号は私がダウンロードした文を表します。反復ごとに、ループはベクトルを文章とともに追加します。
結果をベクトルにする代わりに、それを成長するtxtファイルに保存したいと思います。その理由は、ダウンロードする必要があるデータ量が膨大なためです。ループをしばらく(1000回繰り返す)実行させてから休憩を取ってから、翌日にもう一度実行する必要があります。
そして、私はtxtファイルにいくつかの構造を持たせたいと思います。それで、簡単に文で分割することができます。これは後でそれぞれの文を別々のドキュメントとして作成するDTMを作成したいからです。ループ全体に新しい文章を付加することができますファイルに書き込む方法:
は、だから私は
1を必要とするもの。
2:私がダウンロードした文章に基づいて後でDTMを作成できるように、tmパッケージでそのファイルを読む方法。私が試した何
:
私ははwrite.table()関数を使用していた欲しいものを得ている最も近いです。
write.table(MyVec, file = "output.txt",row.names=FALSE, col.names = FALSE, append= TRUE)
これは私の文章が引用符で区切られたテキストを与えているようだ: 「BLA」 「blablabla」 「Blabla」 等
しかし、私が利用する方法がわかりませんこれは、後で文に基づいてDTMを作成するために、tmでコーパスにそれを読み込むときです。たぶん良い方法がありますか?
write(MyVec, file="output.txt",append=TRUE)
これは私に成長しているtxtファイルを与えるが、文章を分離していないよう:
は、私はまた、書き込み()関数を試してみました。私はそれをコーパスに読み込み、文に基づいてDTMを作成する方法を知らない。私はwriteLines()と見なしましたが、appendオプションを持たないようです。とにかく、テキストを改行したくありません。私は文章を分離したいだけです。
'write.table'に' quote = FALSE'を設定すると、引用符を取り除くことができます。 – Val