2017-08-14 7 views
0

Iは、モデルから出力されるデータの数千のセルを有する:セルIDは、それぞれの行は時間ステップであり、時間ステップの数百を超える各セルの結果をスプレッドシートに印刷され、列ヘッダーです。私は特定のパーセンタイル内のデータを分析したいと思います。 、私は、値が関心のパーセンタイルしきい値のためにあるものを同定してきましたが、私は...Excelでデータをスクラブする方法、特定の範囲外に極端な異常値を削除する方法はありますか?次のように私の結果はフォーマットと

a)は私が興味の範囲の外にあるすべての値を削除する方法について明確な方向性を見つけていませんよシートのために私はシートの外と

値は2進数とされ、さらなる分析のために別々のものに関心のある範囲内の値を引く

又は

B)で働いています場所。

Iは別の工程で、それを分析し、その後、データをスクラブする必要があります。たとえば、時代遅れの極端なmaxとminを削除した後でも、私はまだtimeseries全体を見たいと思っていますが、外れ値は削除されているか、null値に変更されています。 どのようにしてこのデータマトリックスからすべての異常値を選択するか、または単に削除することができますか?それを行うには

答えて

2

最良の方法は、ピボットテーブル機能を使用しています。ピボットテーブルで

あなたは範囲(メインデータと同様外れ値)を使用して、フィルタパラメータを作成することができます。あなたのデータをフィルタリングするために、この希望を行うには Create a PivotTable to analyze worksheet data

+0

質問を明確にする必要があるかもしれません。データをスクラブして分析する必要があります。たとえば、時代遅れの極端なmaxとminを削除した後でも、私はまだtimeseries全体を見たいと思っていますが、外れ値は削除されているか、null値に変更されています。その目的のためにピボットテーブルを使用することはできますか? – cr0

+1

IMHOはそれを行うための最良の方法です。あなたは情報源をそのまま維持して完成させます。あなたはあなたの外れ値を最初に "何"と "どこに"定義してから解析を開始する必要があるでしょうか? – brunohdaniel

+0

ありがとう、私は明日行って、あなたの答えを受け入れるか、または私がしない場合はなぜ教えてください – cr0

1

が、「堅牢」の最も簡単な方法:あなたがピボットテーブルを使用する方法がわからない場合は

は、この上を見てください。その後、すべての適切な値を除外します。 「悪い」セルしか表示されていない場合は、特別なものに行き、表示されているセルのみを強調表示します。そこから削除してください。

は、キーボードショートカットで/効率的にこれを行うには、それはそうのように次のようになります。

  • 1)データのヘッダを選択し、alt + h + s + f
  • 2タイプ)「値」ヘッダをクリックして、適切な番号をクリックしてください除外したくないすべてのデータを取得するまで
  • 3)特別に移動し、可視セルにのみ
  • を選択し alt + h + f + d + s + yを入力し、残りの細胞(これらはあなたが削除され、Excelの行番号は現在、青でなければなりませんしたいデータポイントでなければなりません)
  • 4)のすべてをハイライト
  • 5)行を削除するalt + h + d + rを入力します(これは少し時間がかかりますが、私はそれが動作を期待)

を我慢して!

*** EDIT:代わりに、手動でデータを整理、あなたはまた、サイズのオフに基づいてランク、直接そのようなデータをカットすることができます。答えについてもっと考えてみたら、この方法はもっと簡単になると思います(もっと速くなります)。

+0

@ cr0実装? – Jsleshem

関連する問題