2011-01-02 10 views
1

私はトピック調査と図でいくつかの宿題を持っています。最初のタスクは、データの構造が時々刻々と変化しているため、調査の入力を標準化することです。 だから、調査の3つのタイプがあります。テキストは、ユーザが複数のオプションを選択することができます一つの選択肢 統計量図のアイデアを調べる

  • と複数選択フィールドを、選択することができます
  • ダイナミックなものを、保存されている

    • 静的フィールドは、

    私は実際に統計者ではないので、私はそのデータを使って何ができるのか分かりません。

    私が持っているデータはそこからの膨大なXMLファイルに保存されています。私は簡単に人の調査が満たされた回数とフィールドが何回記入されたかを簡単に知ることができます塗りつぶしたかどうかの関係)。 2番目のアイデアは、棒グラフなどを使って複数のオプション要素の内容の間の関係を示すことです。

    複数のオプション要素の場合、私は1つのオプションを含意することでデータを表示する考えがあります。 しかし、問題は、何が表示される可能性がありますか?

    その他の問題は、静的要素(テキストフィールドなど)です。 1つのフィールドからはどのようなデータを表現できますか?

    XMLフィールドのデータは2001年から2005年に収集されますので、私は調査の日付について作業することができますが、私が言ったように、データの処理方法、可能であれば、本当に大量の図を作成することができます。

  • 答えて

    0

    (あなたの仕事の可視部分よりも難しいかもしれない)あなたのデータを正規化した後、あなたは以下のことを行う可能性があります:

    • あなたはtheeseテキストを書き直すことができ、テキストが含まれているあなたの静的フィールドを表示するにはより少ないカテゴリを含む新しい変数に変更することができます。これはグラフ/プロットに適合します。別の方法は、テキストの単語の雲を作ることです - wordle.netのように。
    • 答えフィールドが1つのみのダイナミックフィールドが最も簡単に表示できます。円グラフを作成して属性のパーセンテージを表示することも、パーセント/密度や頻度を表示できる棒グラフを作成することもできます(例:Rのggplot2パッケージを参照)。
    • 複数選択フィールドを表示するには、日付を適切な形式に再構成する必要があります(私は今のように見えません)。これは、すべての変数のすべてのカテゴリのカウント(頻度)を示すさまざまな表で行うことができます。例:187人がチョコレートを食べ、160人がパンを食べ、50人がピザを食べました。あなたはバサルトで簡単に値を表示することができます。誰かが複数の値を選ぶことができるように、その人物の合計はサンプルサイズと等しくないので、円グラフは本当に悪い選択です。

    私は助けてくれることを願っています。

    0

    円グラフはおすすめしません。代わりに棒グラフまたはドットプロットを使用します。さまざまなカテゴリーの類似した周波数を区別する方がはるかに簡単です。頻度を使ってカテゴリを並べることは、ほとんど常に良い考えです。ここでは、理由についての短い記事を見つけることができますPie Charts Are Bad

    3D図は美しく見えるかもしれませんが、データの視覚化に関する知識がほとんどない人に印象づける良い方法です(これはあなたが必要とするものかもしれません;-))。しかし、絶対に必要とされない余分な次元を使用すると、読者は実際のデータから注意をそらすので、ほとんどの専門家は悪い習慣とみなされます。

    個人的に私は、クロスデータとscatter plotsは、データの2つの次元間の関係を表示するためのかなり自明の方法だと思います。

    基本的な統計情報をダイアグラムとともに報告することはよくありますが、それが適切なときにのみ行うようにしてください。どのような単変量統計(例えば平均など)がどのデータに適しているかを知りたい場合は、Wikipedia articleを参照してください。

    データの視覚化について深くお知りになりたい場合は、そのトピックについてbooks by Edward Tufteを強くお勧めします。彼らは本当に読むのが楽しいです。彼らは堅実な科学的基盤に立っていますが、現場にはほとんど背景がなくても、理解しやすいです。

    幸運、 アレックス

    関連する問題