pandas

    2

    1答えて

    私はパンダで時系列解析をやっており、削除したい異常値のパターンがあります。怒鳴るプロットは、データあなたが散在同様の値のこれらの点を確認しているラインのような可能性の高い機器の癖を見て、必要がありますすることができAS 日として最初の列、2番目の列を持つデータフレームに基づいています除去される。 Iveはrolling_mean、median、および標準偏差に基づく除去を無駄に使用して試しました。

    2

    1答えて

    この問題は、ループ内で異なる変数名を使用することで解決できます。しかし、データフレームを格納できるListの要素の長さを調べることができるかどうかを確認する必要があります。 フォルダに保存されているすべての.csvファイルを読み込むコードを記述しました。私は文字を含むリストを作成しました。今、私はフォルダから1つずつCSVファイルを読み込み、リストの要素にデータフレームとして保存しています。したが

    1

    1答えて

    In [6]: df.a.as_matrix() Out[6]: array([list([1, 2]), list([3, 4])], dtype=object) In [7]: df = pd.DataFrame({'a':[[1,2], [3, 4]]}) In [8]: l = df.a.as_matrix() In [9]: type(l) Out[9]: numpy.n

    0

    2答えて

    私は Data['SUMMARY']=Data['SUMMARY'].str.replace(r'([^\w])',' ') Data['SUMMARY']=Data['SUMMARY'].str.replace(r'x{2,}',' ') Data['SUMMARY']=Data['SUMMARY'].str.replace(r'_+',' ') Data['SUMMARY']=Data[

    2

    1答えて

    巨大なtimeseries DataFrame(約100,000,000行)があり、条件によって行をフィルタリングする必要があります。別のデータフレームの各行に各条件があります。このDataframeには約2000行があり、各行は条件です。 玩具例: df = pd.DataFrame({val: [1, 3, 2, 4, 3, 1, 2, 3], date: [2015-03-12, 2015-

    1

    1答えて

    私はnumpyとpandasにかなり新しいと言って始めましょう。私はパンダのデータフレームを構築しようとしていますが、私は自分が適切なやり方で何かをやっているとは確信していません。 私の設定では、.Netオブジェクトの大量のリスト(私はほとんど制御できません)があり、これからpandasデータフレームを使用して時系列を構築したいと考えています。デモ用に単純なプレースホルダクラスに.Netクラスを置

    1

    2答えて

    私はraw_dfというデータフレームを持っています。 最初の列がE01,E02、... E14の行が必要です。 手動で入力せずに、これを生成できるリストの理解度(または別の方法)を作成するにはどうすればよいですか。 row_data = raw_df.loc[ (raw_df.col0=='E01') | (raw_df.col0=='E02') | (raw_df

    0

    1答えて

    私は、最大値を水平に見つけるコードを書いています。今私はそれを.iloc []関数を使ってデータフレームの他の場所に保存します。それのdtypeがシリーズなので私はそれをすることができません。シリーズを浮動小数点値に変換するには? コード: master = pd.read_csv("new.csv") a = master.iloc[:, 154:181].max(axis=1) print

    2

    1答えて

    マルチインデックスデータフレームに値を設定しようとしています。私は.locを使用していますが、私はまだSettingsWithCopyWarningを取得しています。私はドキュメントを読んだが、私はこれをどうやってやるべきかわからない。私は間違って何をしていますか? 「SettingWithCopyWarning: 値はデータフレームからのスライスのコピーに設定されるようにしようとしている が.L

    1

    1答えて

    私は2つのデータフレーム持っ a b 1900-01-01 1 2 1900-01-02 1 3 1900-01-03 3 3 DF2を(インデックスはintです):マージ後 c 0 3 1 1 : a b d 1900-01-01 1 2 3 1900-01-02 1 3 1 1900-01-03 3 3 つかいます?