pandas

    1

    1答えて

    ローリングウインドウで最新の値をとり、そのウインドウ内のすべての数値の平均で割ることを考えています。 私が試したもの: df.a.rolling(window=7).mean()/df.a[-1] df.a[-1]は常にデータセット全体の中で最も最近のものであるので、これは動作しません。私は窓の最後の値が必要です。 私は今日大量の検索をしました。私は間違った言葉を探しているかもしれませんし、結

    0

    1答えて

    私はパンダを学ぼうとしており、私はgroupbyとnuniqueという小さな問題に遭遇しています。ヘッダで import pandas as pd import numpy as np chicago_dataset = pd.read_csv("https://raw.githubusercontent.com/gjreda/gregreda.com/master/content/note

    0

    1答えて

    には、 'date'という名前のキーを持つデータフレームがあります。最初のいくつかのエントリは次のようになります 0 02.01.2013 1 03.01.2013 2 05.01.2013 3 06.01.2013 4 15.01.2013 今私は、日付として例ではない2014年のためのものであるすべての行をフィルタリングするためにパンダを使用したいです。 私は、チュートリアルを見て

    0

    1答えて

    私の質問を合理化しました。私は入力価格のタイプをフィルタリングするメソッドを作成しようとしています。以下のデータのサンプルである: Open High Low Close 1189.73 1214.01 1188.63 1198.72 1198.67 1201.41 1193.77 1196.35 1195.69 1203.60 1170.78 1176.45 1176.47 1185.

    0

    1答えて

    まず、私のコードには、私が知っている以上に多くの間違いがあるかもしれません。私は次の画像のように私のテーブルのインデックスを作成しようとしています: 私は漸進的に列を読んでいると一緒に、私は合計15000行ごとに500ファイルを読んでそれらを追加しています。今度は、次の図のようにMultiIndexを使用する必要がありますが、pandas階層インデックスとMultIndexを使用してループ内で行う

    1

    1答えて

    私はA、B、Cの3つの列を持つデータフレームを持っています。AとBは0から10までの整数シリーズです。 Aのユニークな値がインデックスである新しいデータフレーム、Bのユニークな値はカラムであり、各セルはAi、Cjの交点で得られた平均値Cである。例えばので 私たちは、このようにデータフレームをグループ化した場合: Cvalues.loc[Cvalues.A==i].loc[Cvalues.B==j]

    1

    1答えて

    私は、データフレームの形式でコンテンツのストリームを取得しています。各バッチは、列の値が異なります。 例えば1つのバッチは、次のようになります。 day1_data = {'state': ['MS', 'OK', 'VA', 'NJ', 'NM'], 'city': ['C', 'B', 'G', 'Z', 'F'], 'age': [27, 19, 63, 40,

    1

    1答えて

    Pandas : populate column with if condition not working as expectedのテキストデータをデータフレームに読み込もうとしています。 dftxt = """ 0 1 2 1 10/1/2016 'stringvalue' 456 2 NaN 'anothersting' NaN 3 NaN 'and a

    -2

    1答えて

    私はPandasのテキスト解析にstr.containsを使用しています。 「私の最新のデータジョブがアナリストだった」という文章の場合、「データ」という語の組み合わせが必要です&「アナリスト」同時に、組み合わせに使用される2つの単語の間の単語の数を指定したいここでは "データ"と "アナリスト"の間の2単語です。現在、私は "DataFile.XXX.str.contains( 'job')&

    -1

    1答えて

    私は郡で候補者投票のためのdfを持っています。 > 100(列合計)の総votationと(X 1192 600)Iは、総votation> 50(行の和)を有する候補を選択するために、元のDFをサブセットする必要 とCountys 私は元のデータに候補者、郡によって合計を持っていない。 import pandas as pd import numpy as np df1 = pd.Dat