2017-08-12 13 views
0

rvestを使用してテーブルからデータを抽出しようとしています。以下は私が使用しているコードですウェブサイトからrvestを使用してテーブルを抽出する

次のコードを使用して、テーブル全体の内容の代わりにヘッダーしか取得できません。

html_table(html_nodes(mcurl, "table.table4")[2],header=FALSE,fill=TRUE) 
[[1]] 
                X1             X2 
1 Balance Sheet of Tata Consultancy Services ------------------- in Rs. Cr. ------------------- 


html_table(html_nodes(mcurl, "table")[4],header=FALSE,fill=TRUE) 
[[1]] 
              X1             X2 
1 Balance Sheet of Tata Consultancy Services ------------------- in Rs. Cr. ------------------- 

答えて

1

私はこの1つでなぜrvest闘争わからないんだけど、あなたは同じことを行うためにXMLパッケージからreadHTMLTableを使用することができます...

library(XML) 
tables <- readHTMLTable("http://www.moneycontrol.com/financials/tataconsultancyservices/balance-sheetVI/TCS#TCS") 

head(tables[[5]],10) 
           Mar 17 Mar 16 Mar 15 Mar 14 Mar 13 
1         <NA>  <NA>  <NA>  <NA>  <NA> 
2        12 mths 12 mths 12 mths 12 mths 12 mths 
3         <NA>  <NA>  <NA>  <NA>  <NA> 
4 EQUITIES AND LIABILITIES            <NA> 
5   SHAREHOLDER'S FUNDS            <NA> 
6  Equity Share Capital 197.00 197.04 195.87 195.87 195.72 
7 Preference Share Capital  0.00  0.00  0.00  0.00 100.00 
8   Total Share Capital 197.00 197.04 195.87 195.87 295.72 
9  Reserves and Surplus 77,825.00 58,669.82 45,220.57 43,856.01 32,266.53 
10 Total Reserves and Surplus 77,825.00 58,669.82 45,220.57 43,856.01 32,266.53 
+0

はreadHTMLTableについて言及いただきありがとうございます。このページに表示されているテーブルからデータを抽出するだけではありません。テーブル「前年」の右側にリンクがあります。これをクリックすると、別のデータセットが表示されますが、html_sessionを使用して抽出するURLと同じURLが表示されるため、rvestを使用してデータを抽出しますが、urlを使用してreadHTMLTableを使用すると制約に直面します。 –

関連する問題