2013-06-10 5 views
6

これは、データの視覚的表現のベストプラクティスと、R/gplot2でプロットを描画する方法の両方に関する質問です。私はグラフィカルに物語を表現する方法を見つけようとしていますカテゴリ(R、ggplot2)への連続的な分離を表すプロットの描画

はここに語った:

「私たちは、500エラーを持っていた2000年のテストケースを、持っていた調査の後、我々はテストの400がビッグだったことがわかりました。 1600は小テストであり、Bigテストのうち25個だけでエラーが発生していたので、1600個の小テストを残しました。そのうちの475個にエラーがありました。小さな時計回りのテストのうち20回でエラーが発生していたので、それらを脇に置いて、小反時計回りのテストを1200回残しました。そのうちの455回にはエラーがありました。

つまり、カテゴリを使用してテストケースを分離しており、各カテゴリのエラーの割合がどのように変化するかを表現したいと思います。ここで

は、データといくつかのRです:データのこの少量の

tests <- data.frame(n.all=c(2000,400,1600,400,1200),n.err=c(500,25,475,20,455),sep.1=as.factor(c("all","Big","Small","Small","Small")),sep.2=as.factor(c("all","all","all","Clockwise","Counter-Clockwise"))) 

、簡単な数値表には最良の選択かもしれません。ストーリーが続行され、より多くの分離カテゴリが使用されていると仮定しましょう。単純に数字をリストするのが最良の選択ではありません。

このデータを表すにはどうすればよいでしょうか?

Four possible plots: pie, bar, bar with path, horizontal bar with path

  1. パイ奪われているパイのスライスを示すチャート、および
  2. バーチャート、同様の
  3. のまま何のエラー/エラーなしの内訳:私はいくつかの可能性を考えることができます Minard's chart of Napoleon's march
  4. 同様に似ていますが、棒グラフは、画分を示すとともに、水平ではなく垂直方向に
  5. カテゴリを離れて分離する「流れ」を示すリボン付き
  6. バーチャート、

すべての4つの方法は、テストケースが減少する絶対量と、分離されたカテゴリのエラーの割合、および残っているものを示しています。私は最高の#4が好きだと思うが、私はオープンな心を持っている。

この種のデータをどのように表現する必要がありますか?また、R/gplot2を使用してそれを行うことはできますか?

+0

パッケージ 'vcd'を見てください。しかしそれは、これはSOのための良い質問ではないと私は言った。 –

+1

これは興味深い質問だと思いますが、StackOverflowのためにあまりにもオープンになっているかもしれません。 CrossValidatedは、プログラミング関連よりも概念的なデータ視覚化問題を歓迎する場合もあります。私はおそらく、確かめるために、尋ねる前にチャットや何かで尋ねるでしょう。 – joran

+0

あなたが望む視覚化がわかったら、コード – alexwhan

答えて

0

グラフを描画するときに並ばなければならない3つのことを覚えておいてください。あなたが話しているメッセージ、データがあなたに伝えているメッセージ、そしてグラフがあなたに伝えているメッセージが表示されます。 私の意見では、あなたの選択肢4は一貫してメッセージを得るための最良のものです。

Iも薄手の除去によって番号4に到着する;あなたは円グラフを比較し、水平方向の流れと垂直な表現を組み合わせているので)

列は適していないにも行うことは容易ではない(たとえ円グラフ内異なるパーツを比較することは既に困難です)ので、どちらもオプションではありません。実際にオプション4を残してください:)

また、Sankey Diagramを試すこともできます。Sankey Diagrams in R?は役に立ちます

関連する問題