-1
私のPCのフォルダに複数のHTMLファイルがあります。私はRでそれらを読んで、元のフォーマットをできるだけポーズできるように保ちたいと思います。ちょうどテキストがあります。私は2つのアプローチを試してみました。それは失敗しました:複数のローカルHTMLファイルをR内のフォルダに読み込みます
##first approach
library (tm)
cname <- file.path("C:", "Users", "usuario", "Desktop", "DEADataset", "The Phillipines", "gazzetes.presihtml")
docs <- Corpus(DirSource(cname))
## second approach
list_files_path<- list.files(path = './gazzetes.presihtml')
a<- paste0(list_files_path, names) # vector names contain the names of the file with the .HTML extension
rawHTML <- readLines(a)
どれでも推測できますか?すべて最高
ありがとう!私は完全にこれらの事件のために '' lapply''の使用を忘れてしまった。ちょうどレコードのため:私は猫を使用すると、私は "爆弾"(セッションが中止)を取得 –
再:猫の爆弾...おそらく文字列の文字サイズの制限を超えている?私がこれをテストしたとき、私は比較的短い文字列の2つの小さなhtmlファイルを使用しました。 – jdbcode
Heheの猫の爆弾。はい、あなたは正しいです。 –