ありがとうございます!私は数日間これを試してきました、そして、私は固執しています。私はテキストファイル(リストとしてインポート)をループし、テキストファイルからデータフレームを作成しようとしています。リスト内の項目にテキストの曜日がある場合、データフレームは新しい行を開始し、最初の列(V1)に入力されます。残りのコメントを2番目の列(V2)に入れたいので、文字列を連結しなければならない場合があります。私はgrepl()で条件を使用しようとしていますが、私は最初のデータフレームを設定した後にロジックが失われてしまいます。テキストをループしてデータフレームを作成する
ここでは、テキストファイルからFacebookデータであるRに取り込むテキストの例を示します。 []はリスト番号を示します。それは長いファイル(50K +行)ですが、私は日付の列を設定しています。
[1] 15:57 EDT
[2] フットボール時の2016年8月25日(木曜日)!!我々は計画を立てる必要がある!!私は昨年触れられていませんが、私の男に文章をしました。だから私は私の最後に見える!あなたは何を食べていますか?
9:17 EDTで[3] 2016年8月14日(日曜日)
[4]マイケルはジェイソンの投稿を共有しました。
[5]この鳥は最近、ここで私は読んだことが政治的ポストの大半よりもたくさん賢くある
[6] 2016年8月14日(日曜日)午前8時44分午前EDTで
[7]マイケルとKurtは今の友達です。
最終結果は、曜日がデータフレームで新しい行を開始し、残りのリストがデータフレームの2番目の列に連結されるデータフレームになります。そうエンドデータ名声は(V2にV1 [1]および[2])
行1あろう
行2(V1 [3]及び[4]、[5] V2で)
行3([6] V2にV1及び[7])に
ここでは、私のコードの開始であり、Iは、データフレームの第2列V1を正しく取り込むために得ることはできませんが。
### Read in the text file
temp <- readLines("C:/Program Files/R/Text Mining/testa.txt")
### Remove empty lines from the text file
temp <- temp[temp!=""]
### Create the temp char file as a list file
tmp <- as.list(temp)
### A days vector for searching through the list of days.
days <- c("Sunday", "Monday", "Tuesday", "Wednesday", "Thursday","Friday", "Saturday")
df <- {}
### Loop through the list
for (n in 1:length(tmp)){
### Search to see if there is a day in the list item
for(i in 1:length(days)){
if(grepl(days[i], tmp[n])==1){
### Bind the row to the df if there is a day in the list item
df<- rbind(df, tmp[n])
}
}
### I know this is wrong, I am trying to create a vector to concatenate and add to the data frame, but I am struggling here.
d <- c(d, tmp[n])
}
'dput'を使用してデータを共有してください。 –