2017-03-25 4 views
-2

StackOverflowの最初の投稿!私はRの初心者であり、データサイエンスのためにそれを学ぶためのいくつかのオンラインコースを行っています。私はggplot2を使って時系列解析や可視化に使用できるように、データのフォーマットを整える手助けをしてくれることを願っています。私は検索を試みましたが、用語知識がまだ不足しているときには、良い検索をするのは難しいです(データの操作、munging、wrangling、data-cleaningなど)私は後です)。時系列解析と視覚化のためにこのデータを再フォーマットするためのコードは何ですか?

私のデータは現在like thisですが、thisのように見えます。私はどのようにそれをRで行うのですか?いくつかのパッケージは私を助けるだろうか?

注:「純所得」と「年」列が切り替わるかどうかは気にしません。また、私は、excelを使用して、目的のデータフォーマットのスナップショットを素早く作成しました。

このデータセットは約2000行続けていますので、Rで使用するコードは何でも、巨大なデータセットでも動作する必要があります。

ありがとうございました!

広いから長い形式に行くジョン

+0

例データを質問に入れます。 imgurのリンクは恐らく永遠に残ることはありません。 [mcve]を参照してください。一方で、「変形」を調べる。 – dash2

答えて

0

は、パッケージreshape2を参照してください。

library(reshape2) 

#Get a vector that includes the column names you want to change from wide to long format, e.g. 
yearsVector=c("2006","2007","2008") 

melt(dat, measure.vars=yearsVector, variable="Year", value.name="income") 
0
data_melted <- melt(data, id.vars = c("company", "sub.industry"), measured.vars = c("2006","2007","2008", "2009", "2010", "2011", "2012", "2013", "2014", "2015", "2016"), variable = "Year", value.name="income") 

reshape2パッケージをインストールし、Rスクリプトでそれをロードした後にトリックをしました!ありがとうstackoverflowメンバーdash2とコーリー!トータルな初心者を助けるために行く方法!今すぐ視覚化する!

関連する問題