pandas-groupby

    1

    1答えて

    ある任意のインスタンスを削除する必要があります。 : 基本的に patient_id event_description A DiagnosisA 2016-01-15 A DiagnosisA 2016-02-10 A DiagnosisA 2016-04-20

    2

    2答えて

    これは私のデータ・フレームの例である: df_lst = [ {"wordcount": 100, "Stats": 198765, "id": 34}, {"wordcount": 99, "Stats": 98765, "id": 35}, {"wordcount": 200, "Stats": 18765, "id": 36}, {"wordcount

    3

    1答えて

    2つのカテゴリ変数間の頻度の平均と中央値を取得する必要があります。例: ラベル文字番号 Foo | | 1 Foo | B | 2 Foo | C | 4 バー| | 2 バー| G | 3 バー| N | 1 バー| P | 2 Cee | B | 1 Cee | B | 2 Cee | C | 4 Cee | D | 5 たとえば、ラベルあたりの平均文字数と中央値は何ですか?ここでは、3つの可

    0

    1答えて

    私のCSVファイルには都市別の気象情報があります。 1つの行には、(1200以上の)列が非常に多くあります。たとえば、それは次のようになります。 id city_name dt_0 temp_0 hum_0 dt_1 temp_1 hum_1 dt_2 temp_2 hum_2 1 Boston 2017110306 23.5 54.0 2017110310 21.4 40.0 2017

    1

    1答えて

    私は古典的なxarrayデータセットを持っています。これは毎月のデータ(38年間の月次データ)です。 私は毎月の分位値を別々に計算することに興味があります。例えば <xarray.Dataset> Dimensions: (lat: 26, lon: 71, time: 456) Coordinates: * lat (lat) float32 25.0 26.0 27.0 2

    -1

    1答えて

    groupbyとsumで作成されたサマリーデータに基づいて積み重なった領域プロットを作成します。 groupbyとsum部分は、適切なグループ化と集計を行いますが、結果の形式はプロットする意味がありません。ここからどこへ行く は、私はよく分からない: import pandas as pd import numpy as np import matplotlib.pyplot

    1

    1答えて

    動的な値のリスト(例:観測値)があります。エンティティのすべての値の変更(たとえば、表示)を記録します。 df +----+---------------------+-----------------+---------+ | | time | display_index | value | |----+---------------------+-----------------+

    0

    1答えて

    私がしようとしているのは、列Aのさまざまなチームをグループ化し、各値が何回表示されるかの合計数を取得することです。一例として、Team1が4回現れます。私はカウント値(Team1と4つ)をB列に何回表示するのかを分けてパーセンテージを求めたいと思います。 Current A B C Team1 Yes 4 Team2 Yes 1 Team1 No 4 Team3

    0

    1答えて

    次のデータフレームからカウントを生成するPythonスクリプトを作成しようとしています。私はExcelでcountifsを使用していましたが、 'Sample'と 'Region'に重複しているためcountifsの使用に問題があります。 例入力DFは: Sample Chr Start End Region Size Strand Chr2 Start2 End2 Coverage Overla

    0

    2答えて

    私はdatetimeindexのデータフレームを持っています。 >>> df.head() Out[6]: 1 2004-01-02 09:00:00+11:00 0.7519 2004-01-02 10:00:00+11:00 0.7520 2004-01-02 12:00:00+11:00 0.7515 2004-01-02 13:00:00+11:00 0.