pandas

    0

    1答えて

    データセットに20の列があり、入力として19を使用したいとします。入力列は1:10と12:20の列です。11番目の列を出力として使用します。パンダを使ってこのような範囲を与える方法は?例えば :Example Data Set は、それが4列を持つデータの上に考えるが、私は入力にのみ3列を取るために持っていますが、これらの列はB、D、Eをしていると私はC列をスキップしたいです。今すぐ私は 入力=

    1

    1答えて

    私はpandasシリーズを使用しています。これを1つのホットエンコーディングに変換しようとしています。私はdescribeメソッドを使用して、一連のユニークなカテゴリの数を確認しています。出力は次のとおりです。 input['pattern'].describe(include='all') count 9725 unique 7 top 1 fr

    1

    1答えて

    私は、次のデータフレームがあります。 chr start_position end_position gene_name 0 Chr Position Ref Gene_Name 1 chr22 24128945 G nan 2 chr19 45867080 G ERCC2 3 chr3 52436341 C BAP1 4 c

    1

    1答えて

    新しい列を作成しようとしています。これは「HomeForm」と呼ばれます。これは、各項目の「FTHG」の最後の5つの値の合計です。 "HomeTeam"の列。 チーム0の場合、チーム0に対応する "FTHG"の最後の5つの値の合計を新しい列のセルに挿入することが考えられます。テーブルは日付順に並べられます。 どのようにしてPythonで実行できますか? HomeTeam FTHG HomeFor

    0

    1答えて

    私の意図はラベルを置き換えることです。辞書を使ってデータフレームにマップする方法について知りました。そのために、まず必要なフィールドを抽出して辞書を作成し、マップ関数に渡しました。 次のように私のプログラムは次のように factor_name = 'Help in household' df = pd.read_csv('dat.csv') labels = pd.read_csv('labe

    0

    1答えて

    これまでのところ、私はこのコードを持っています: csvデータが読み込まれ、プロットボタンが押されたときに、図1と呼ばれる2つのメインともう1つのウィンドウが表示されます グラフは別のウィンドウ図2) この問題を解決するにはどうすればよいですか?あなたの時間のために多くの、多くの多くのおかげです!パンダの import sys import pandas as pd import matplo

    1

    1答えて

    私の質問は、このトピックの論理的な続きです。 Setting values with multiindex in pandasしたがって、この例と答えは私の状況にも合っています。 彼らは​​ とマルチインデックス値を設定する。しかし、私の場合には、 iは、多くのインデックス・レベルのカスタム番号のデータフレームのを持っているので、私は指定せず、唯一の最後のレベルにインデックスを使用したいです他のも

    1

    1答えて

    Pandas DataFrameの行を、最大のような各列の特定の条件で整列する最も効率的な方法は何ですか? ここでは、各列の最大値を見つけた後に手動で列をシフトする例を示しますが、より簡単で効率的な方法があることを期待しています。アライメント前 tmp = yearly_data_scaled.filter(regex="ZW") # DataFrame to align tmp.describ

    1

    1答えて

    私はpandasを使ってExcelファイルからいくつかのデータを読んでいました。パイソン辞書を作ってjsonファイルに入れました。 問題は、私はJSONファイル自体にUnicode文字を取得していますということです。私はUnicodeの「\のu00a0」をしたいし、代わりにそれのデコードされた文字表現を望んでいない上に示されているように "C V M College of Fine Arts,\u