2017-10-08 9 views
1

私は、オンラインで使用可能なレポートを読むためのRでプログラムを開発し、最初の2行は、次のとおりです。なぜgrep()はreadLines()の後に動作しませんか?

page1 <- readLines("http://reportviewer.tce.mg.gov.br/default.aspx?server=noruega&relatorio=SICOM_Consulta/2013_2014/Modulo_AM/UC03-LeisOrc-RL&municipioSelecionado=3100203&exercicioSelecionado=2014") 
line1 <- grep("Leis Autorizativas",page1) 

プログラムの残りの部分がうまく働いたと私は私が必要なデータを得ました。それから私は別のレポートを読むためにそれを適応しようとしたが、今回は2行目は動作しませんでした:

page2 <- readLines("http://reportviewer.tce.mg.gov.br/default.aspx?server=noruega&relatorio=SICOM_Consulta/2013_2014/Modulo_AM/UC08-ConsultarDecretos-RL&municipioSelecionado=3101607&exercicioSelecionado=2013") 
line2 <- grep("Decretos de Alterações",page2) 

第一の場合には「ページ1」は文字ベクトルであると「ページ2」である第二の場合にはa 大きい文字ベクトルです。この違いが問題を引き起こした可能性はありますか?もしそうなら、それを修正する方法について誰かがヒントを持っていますか?

(htmltab()またはreadHTMLtable()を使用して良い結果を生じなかった)

はありがとうございます。

+0

あなたが示したリンクが私の最後 – akrun

答えて

2

「Decretos deAlterações」は完全にASCII文字で構成されていないためです。

あなたはそれが動作

page2 <- readLines("http://reportviewer.tce.mg.gov.br/default.aspx?server=noruega&relatorio=SICOM_Consulta/2013_2014/Modulo_AM/UC08-ConsultarDecretos-RL&municipioSelecionado=3101607&exercicioSelecionado=2013") 

grep("Decretos de Altera&#231;&#245;es ", page2) 

[1] 366 

としよう。

utf8ToInt("ç") 
[1] 231 

その後&;間の結果の数値を入れて、あなたの非ASCII文字を置き換える:交換のために置くためにどのような数を知ること

ベスト

コリン・

+0

グレート、コリンにオープンすることはできません!どうもありがとうございました。 – ViniLima

関連する問題