リリース欄のEmployment Situationを含む日付はすべて、http://www.bls.gov/schedule/news_release/2015_sched.htmここからウェブスクレイプする必要があります。 Web廃棄の出力は次のようになります。日付と文字列によるテーブルからのWebスクラップR
Friday, January 09, 2015
Friday, February 06, 2015
Friday, March 06, 2015
Friday, April 03, 2015
Friday, May 08, 2015
Friday, June 05, 2015
Thursday, July 02, 2015
Friday, August 07, 2015
Friday, September 04, 2015
Friday, October 02, 2015
Friday, November 06, 2015
Friday, December 04, 2015
これを実現するには、次のようなことを12回、毎月1回繰り返すと考えました。注http://www.bls.gov/schedule/news_release/2015_sched.htmには、月ごとに1つずつ、tbl2[[2]]
、tbl3[[3]]
という12個のテーブルがあります。
library(rvest)
url <- 'http://www.bls.gov/schedule/news_release/2015_sched.htm'
ses <- html_session(url)
tbl <- html_table(ses, fill = T)
nfpdates <- tbl[[2]]$`Date`
nfpdates <- gsub('\\.', '', nfpdates)
nfpdates <- as.Date(nfpdates, 'weekdaystr(iD,:), %b %d, %Y')
動作しません。最初の問題は簡単です:私は曜日を参照する方法を知らない:'weekdaystr(iD,:)
が間違っています。 2番目はもっと複雑です:「リリース」の下に「雇用状況」を含むテキストのみを抽出する方法は?
ご協力いただければ幸いです。ありがとうございました。
ありがとう! ''%A、%B%d、%Y "'の大文字と小文字の違いはありますか? – Krug
@Gracosはい。形式についての概要を知りたい場合は?strptimeを参照することができます。 –