私は1000+列の巨大なデータセットを持っています。それらのほとんどに* NaNの*またはほんの数の値が含まれています。各列を手動でふるい分けることは、無理な時間の無駄です。 1つのコマンドで列の多様性、トップ周波数値などを推定するにはどうすればよいですか?パンダ:列の値を一目で把握
1
A
答えて
0
まず、あなたがそのようなループのために作ることができますので、含まれている単一何の列を取得する必要があります。
column = [array[i] for i in range(0,len(array), STEP]
どこSTEP =あなたのファイル内の列の数が
次に、あなたが行うことができますあなたが望むものは何でも。あなたの質問に答えると 、つまりmax(column) - min(column)
を使用すると、多様性が得られます。
+0
これは 'dataframe.describe()'と比較してかなり非効率的です。 –
関連する問題
- 1. smtpサーバホストを把握
- 2. Springロギングを把握する
- 3. facebook iFrameクライアントの把握
- 4. Androidデバイスでのパッケージバージョンの把握
- 5. シンプルコンソールゲームのポイントを把握する
- 6. :ホバリングローテーションCSSの位置を把握して
- 7. JavaScript window.getSelection()は把握できません
- 8. メイクファイルの意図したターゲットシステムの把握
- 9. DataGridのアクティブなRowDetailsの把握方法
- 10. Wiresharkのpcapファイル - 外部DNSの把握
- 11. PHPクエリcant問題を把握
- 12. Android/Java - 日付を把握する
- 13. 異なるCoNLLフォーマットの把握
- 14. パンダ:一部の列の合計値
- 15. のpythonパンダ:1列目のルックアップ値は、他の列を条件
- 16. Cでマルチスレッドの問題を把握できない
- 17. 前後のフックでシナリオ情報を把握できますか?
- 18. 私はのは、それを把握couldn、連想配列で5にインデックス3からの値をエコーしたい、
- 19. これをどのように把握するのですか?
- 20. IOSは、グレーのキーボードボタンでの日陰を把握
- 21. このループの振る舞いを把握できません
- 22. 2つのモデル間の関係を把握できません
- 23. gitサブモジュールの動作を把握できません
- 24. Djangoでオブジェクトが受け取るビューの数を把握する
- 25. YITH無限スクロールの設定を把握できない
- 26. Elisp:setqとソートの効果を把握できない
- 27. CASE WHENを使用して別の列のレコードの個数を把握する
- 28. COALESCE演算子がどの列/値を正常に選択したか把握するには?次いで
- 29. スタックトレースエラーで問題を把握できません
- 30. パンダ:文字列一致後の列の次の値を取得
'pandas.DataFrame.describe()は'パンダドキュメントの入門テキストで非常に早い段階で紹介されています:のhttp://pandas.pydata私はあなたがそこに見てくださいトップ共通の値を取得するには .org/pandas-docs/stable/10min.htmlを参照してください。http://pandas.pydata.org/pandas-docs/stable/10min.html#histogramming –
「少数」の値はどういう意味ですか? 離散的な繰り返し値または浮動小数点値がありますか? – FLab