pandas

    0

    1答えて

    私はカラムで連結された2つのパンダのデータフレームを持っています。左のデータフレームは「古い」とキーイングされ、右のデータフレームは「新規」としてキーイングされます。各データフレームは同じ列名を持ち、「新しい」列の1つによってsort_valuesを作成したいと考えています。私は "Old"と "New"キーのためにソートにアクセスすることはできません。誰でも回避策がありますか?ありがとう。 編集

    1

    1答えて

    をフロートするパンダにデータフレームを変換:私はここで間違っ calcMeanPrice_df = dessertApples_df.iloc[:, 5:17] #slice of columns for col in calcMeanPrice_df: #iterate columns pd.to_numeric(col, errors = 'coerce')

    1

    1答えて

    私はpandas.read_hdfで、大きな(約10 GB)HDF5テーブルに読んでいます。私は一度にチャンクにアクセスできるようにiterator = Trueを使用しています(たとえば、chunkksize =一度に100,000行)。 は、どのように私はすべての列名または「キー」のリストを得るのですか? また、どのようにpandas.read_tableのためのものと類似何get_chunk

    -1

    2答えて

    私はデータフレームを持っているの数値に変更し、dfを言う、:今すぐ id property_type1 property_type pro 1 Condominium 2 2 2 Farm 14 14 3 House 7 7 4 Lots/Land 15 15 5 Mobile/Manufactured Home 13

    0

    1答えて

    私はDateTimeインデックスを持つpandas DataFrameを持っています。 私はそれからtimeseriesをプロットすることができ、デフォルトでは正常に見えます。 しかし、同じDataFrameから棒グラフを印刷しようとすると、xAxisのラベルが壊れてしまいます(大規模なオーバーラップ)。 (また、データの間隔が )のバーのセットの間に奇妙な(大きなギャップである私はautofor

    1

    2答えて

    私は2つの列を比較し、比較の結果に基づいて新しい列を作成するPandas Dataframeを得ました。 Logicは、次のようになります。 If df['column1']>df['column2'] : df['New column']=(df['column1']+df['column2']) else : df['New column']=(df['column1']

    0

    2答えて

    私は4つのシリーズオブジェクトnSer1、nSer2、nSer3、nSer4を持っています。シリーズを乗算し、結果の4番目のルートを取るnSerGMeanを作成する方法。 nSerGMean=(nSer1*nSer2*nSer3*nSer4)^(1/4)

    1

    1答えて

    私は、寄木細工のタイプのファイルを読み込み、それをpandasデータフレームに変換するpythonプログラムに取り組んでいます。それは私がPythonのコマンド(python framework1.py arg1 arg2)を実行するために使用している間、うまく動作します。しかし、pyinstallerを使用して実行可能ファイルに変換した後、実行ファイルが実行されると、次のエラーが発生します。事前

    1

    4答えて

    s3バケットにjsonファイルを読み込み、それをpandasデータフレームに解析/フラット化しました。今私は個人的に識別可能な情報を含む4列の175列のデータフレームを持っています。 私はこれらの列(名前&アドレス)を匿名化する簡単な解決策を探しています。同じ人物の名前や住所に複数回出現した場合、同じハッシュを持つように、複数の情報を保持する必要があります。 パンダやこれに利用できる他のパッケージ

    3

    4答えて

    データフレームの最初の行のデータをその列名&の最初の行を削除して追加します。 ソースDATAFRAME: 2013K2 2013K3 2013K4 2013K5 ABC1 ABC2 ABC3 ABC4 324 5435 543 543 6543 543 657 765 765 876 876 9876 は、列名+として、列名を変更する必要がある '|' 最初の行の+データ: 2013K