2016-09-19 6 views
0

したがって、「RetailSales2014」には金額が含まれています。私は統計分析を行うためにコンマを削除する必要があることを知っていますが、先頭の '$'記号も削除する必要がありますか?もし私がしたら、どうやってそれらを取り除くのですか?列「RetailSales2014」の統計情報を取得するにはどうすればよいですか?

# Load packages 

ライブラリー( "XML") ライブラリー( "RCurl")

は、URLを指定し

URL < - "https://nrf.com/2015/top100-table"

は、URLのコンテンツをダウンロード

url_content < - getURL(url)

HTML/XMLツリーを表すR構造を生成するためにHTML/XMLコンテンツを解析

DOC < - htmlParse(url_content)

テーブル< - readHTMLTable(DOC)

がの第3要素を変換データフレームにリスト

retailer_df < - data.frame(テーブル)

属性(retailer_df)

名前変更retailer_df列

COLNAMES(retailer_df)< - C( "ランク"、 "会社"、 "本社"、 "RetailSales2014"、 "USASalesGrowth"、 "WorldwideRetailSales"、 "USAPercentageOfWorldwideSales"、 "Stores2014" 、 "成長")

要約(retailer_dfは)

)、作業ディレクトリの下にファイル= "top100retailers2015.csv" を

write.csv(retailer_dfをCSVファイルに小売店データを書き込み

答えて

0
retailer_df$RetailSales2014 <- 
    as.numeric(gsub("(\\D)", "", retailer_df$RetailSales2014)) 
+0

これはうまくいきました。私たちの教授は、今週末にこれを行う方法を教えてくれるでしょうが、私は数値変換を理解する上で頭を下げたいと思っていました。 – user6794408

+0

お待ちください...私はあなたの宿題を手伝ってくれましたか? smh。 – AidanGawronski

+0

いいえ、割り当ては既に私が提供したコードで終了しました。 「RetailSales2014変数の最小値、中央値、平均値、最大値は得られますか?なぜですか?答えは次のボックスに入力してください。」それは正確な言葉遣いです。私は不正行為ではなく、率直であることを願っています。私はこのコミュニティがRを学ぼうとしている学生にはあまり歓迎していないと思います。 – user6794408

関連する問題