2017-06-14 4 views
1

私はパンダのデータフレームを持っています。それぞれの列をチェックしたいと思います。値が.92以下になると値は1になります。これを達成するための簡単な方法は?パンダは、特定の値の後に列1のすべての値を作成します。

+0

あなたの質問は不明です。値が0.92以下になると、その列の値を1に変更した後にすべての値を変更したい場合、各列を上から下、列内でチェックすることを意味しますか? –

+0

申し訳ありませんがフレームを書いておく必要がありますが、私は電話をかけていますが、それは痛みです...しかし、基本的に列の値が1.01、.98、.97、.92、.93、.91の場合、 1.01、.98、.97、.92、1、1に変更する列。ありがとう! – James

+0

列にもパターンがありますか?あなたの例では、私は値が降順であることを見ることができますか、それはちょうど偶然です。 –

答えて

2

はブールデータフレームのデータフレームdf

np.random.seed([3,1415]) 
df = pd.DataFrame(np.random.rand(10, 10) * 10, columns=list('ABCDEFGHIJ')).round(2) 

使用cumprodを考えてみましょう。そして、私の解決策についてでpd.DataFrame.where

df.where(df.gt(.92).cumprod().astype(bool), 1) 

     A  B C  D  E F  G  H  I  J 
0 4.45 4.08 4.6 4.65 4.63 1.0 8.50 8.18 7.78 7.58 
1 9.35 8.31 8.8 9.27 7.22 1.0 1.46 2.00 4.38 1.01 
2 2.79 6.10 1.0 8.37 7.40 1.0 6.91 3.77 2.25 4.35 
3 7.01 7.01 1.0 1.00 7.01 1.0 7.65 2.53 5.48 7.79 
4 6.52 1.36 1.0 1.00 2.75 1.0 7.14 7.76 5.42 8.37 
5 5.38 1.86 1.0 1.00 3.74 1.0 7.76 1.00 5.04 6.71 
6 6.20 3.02 1.0 1.00 3.68 1.0 8.82 1.00 4.96 8.06 
7 1.00 4.38 1.0 1.00 1.00 1.0 5.85 1.00 6.39 1.33 
8 1.00 8.82 1.0 1.00 1.00 1.0 1.00 1.00 6.06 4.02 
9 1.00 6.41 1.0 1.00 1.00 1.0 1.00 1.00 1.09 3.15 

何かが私を気にすることを使用します。だから私はasked my own question here.です。これは、リンクされた質問からのアドバイスを考慮して、より良い解決策です。リンクをたどり、質疑応答に感謝の意を表してください。ありがとう。

v = df.values 
mask = np.logical_and.accumulate(v > .92, 0) 
pd.DataFrame(
    np.where(mask, v, 1), 
    df.index, df.columns 
) 

     A  B C  D  E F  G  H  I  J 
0 4.45 4.08 4.6 4.65 4.63 1.0 8.50 8.18 7.78 7.58 
1 9.35 8.31 8.8 9.27 7.22 1.0 1.46 2.00 4.38 1.01 
2 2.79 6.10 1.0 8.37 7.40 1.0 6.91 3.77 2.25 4.35 
3 7.01 7.01 1.0 1.00 7.01 1.0 7.65 2.53 5.48 7.79 
4 6.52 1.36 1.0 1.00 2.75 1.0 7.14 7.76 5.42 8.37 
5 5.38 1.86 1.0 1.00 3.74 1.0 7.76 1.00 5.04 6.71 
6 6.20 3.02 1.0 1.00 3.68 1.0 8.82 1.00 4.96 8.06 
7 1.00 4.38 1.0 1.00 1.00 1.0 5.85 1.00 6.39 1.33 
8 1.00 8.82 1.0 1.00 1.00 1.0 1.00 1.00 6.06 4.02 
9 1.00 6.41 1.0 1.00 1.00 1.0 1.00 1.00 1.09 3.15 

タイミング

%timeit df.where(df.gt(.92).cumprod().astype(bool), 1) 
1000 loops, best of 3: 844 µs per loop 

%%timeit 
v = df.values 
mask = np.logical_and.accumulate(v > .92, 0) 
pd.DataFrame(
    np.where(mask, v, 1), 
    df.index, df.columns 
) 
10000 loops, best of 3: 65.8 µs per loop 
+0

以前はdf.gtについて聞いたことがありません。 .gtコールの前に、そのdfの1.00すべてが0.92以下になるでしょうか? – James

+0

@James私はあなたに同じデータフレームを再構築するコードを与えました。あなた自身を見て、見てください。 :-) – piRSquared

+0

ありがとう!私は明日の決勝戦の後にコードで試合を行い、それが私の友人に働くならあなたの答えを受け入れるでしょう! – James

関連する問題