2015-11-10 3 views
5

これまでにパンダでこの問題を見たことがある人はいますか?基本的には、DataFramesを要素単位(すべてのフレームが同じインデックスと列を持ちます)で追加、掛け算、および分割しようとしていますが、Pandasは同じ計算で連続して異なる結果を吐き出しています。パンダのデータフレーム計算の不安定性

出力例を以下に示します。私はディスプレイ目的のために.valuesを以下のコードで使用しましたが、.add(),.mul()、または.div()を使用するときに不安定性が発生する可能性があります。たとえば、私が繰り返しN11.add(N00)と入力すると、私は通常正しい答えを得ますが、時折(4回目または5回目ごとに)、0で埋められたDataFrameが得られます。

enter image description here

それが重要ならば、私は(スパイダー2.3.7上のPython 2.7.10で)パンダ0.17.0のアナコンダ分布を使用してWindows 10上です。私が扱っているフレームは大きい(6815 x 12511)。他の誰かがこの問題に遭遇しましたか?これは既知の問題ですか、何か間違っていますか?

+0

興味深い - 小さなDataFramesで動作を再現し、質問の一部としてここに投稿することができますか? –

+0

(NumPy配列を乗算するだけの場合はNumPyの問題かもしれません) –

+0

さて、10x10の小さなフレームで試してみましたが、ほぼ100回試してみると再現できませんでした。多分サイズはここで重要です。 – user3111891

答えて

2

今日も同様の問題が発生しました。原因はa bug in numexpr 2.4.4です。それはthis pandas ticketとそれにリンクされて報告されているように、様々な方法で他のパンダのユーザーを刺すようです。

numexprを2.4.6にアップグレードすると、私たちの問題は解決しましたが、2.4.4でないバージョンは問題ありません。

+0

ありがとう!それはそれを修正するように見えた。いくつかの奇妙な理由のために、問題はしばらくの間それ自身で離れました。私は無関係な理由のためにその期間中に数回Anacondaを再インストールしたので、修正は再インストールのためかもしれないと思った。そして、突然、昨日Windowsのアップデートが私に押し付けられ、すべてが再び破られました。 numexprをv2.5に更新しましたが、すべて正常に戻りました。どのような奇妙なバグ! – user3111891

+0

@ user3111891、ええ、Windows特有の問題についてリンクしたnumexprチケットには言及していたと思います。特定のアップデートや、システム全体の状態に関する何かにリンクすることができます。この回答が問題を解決することに同意しているように見えるので、それを受け入れたとマークできますか?私は大きなstackoverflowユーザーではありませんが、うまくいった仕事の担当者の少しを得ることはいいです! :)(http://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work) – mactyr

+0

こんにちはmactyr、はい、申し訳ありませんが、私はそれをやろうとしていたが、私のstackoverflowの無知では、上向きの矢印をクリックしようとしましたが、それは私があまりにも初心者だからサイトによって拒否されました。私は今、小切手を見て、私はあなたに大賞(おめでとう!)と分かち合うことに感謝してくれてうれしい! – user3111891

関連する問題