2017-03-02 11 views
1

私は分析と解決のために行列にデータを追加しようとしていますが、現在はブルートゥース演算を実行していますので、分析に別の列を追加するとpythonの制限を超えます。組み合わせによってブルートゥースを使用するのではなく、同様の結果が得られるソルバーメソッドがありますか? sample.csvも以下にリストされています。アドバイスありがとう。Python、ソルバーのメソッドまたは現在のコードの最適化?

import csv 
import itertools as it 
import numpy as np 

C = 2618.08 
B = 933.15 
A = 932.37 
adjust = 1 


D = csv.reader(open('sample.csv')) 

float_ABC = [] 
OUT = np.zeros((3, 9)) - 100 

for row in D: 
     float_ABC.append([str(x) for x in row]) 

float_ABC = float_ABC.astype(np.float) 

Alpha=float_ABC[:, [0,3,6,9,12,15]] 
Beta=float_ABC[:, [2,5,8,11,14,17]] 
Phi=float_ABC[:, [1,4,7,10,13,16]] 

plines1 = it.product(Alpha[0],Alpha[1],Alpha[2],Alpha[3], 
        Alpha[4],Alpha[5],Alpha[6],Alpha[7], 
        Alpha[8]) 

plines2 = it.product(Beta[0],Beta[1],Beta[2],Beta[3], 
        Beta[4],Beta[5],Beta[6],Beta[7], 
        Beta[8]) 

plines3 = it.product(Phi[0],Phi[1],Phi[2],Phi[3], 
        Phi[4],Phi[5],Phi[6],Phi[7], 
        Phi[8]) 


for count in range(0,6**9): 
    sumA = next(plines1) 
    sumB = next(plines2) 
    sumC = next(plines3) 

    if (sum(sumC)+B)/(sum(sumA)+C) <= (B+adjust)/(C) and \ 
     (sum(sumC)+B)/(sum(sumA)+C) >= (B+adjust-10)/(C) and \ 
     (sum(sumB)+A)/(sum(sumA)+C) > (sum(OUT[2])+A)/(sum(OUT[0])+C): 
     print("#",count,"- new option found!") 
     OUT = np.vstack((sumA,sumC,sumB)) 

とsample.csv:

13.4,-18.81,-24.75,5.82,-8.21,-10.8,0,0,0,3.3,1.56,2.05,-2.1,5.36,7.05,2.6,5.65,7.44 
0,-11.01,-14.49,0,-4.87,-6.41,0,0,0,0.6,2.24,2.95,1,4,5.26,1.7,2.73,3.59 
0,-40.74,-53.6,0,-17.86,-23.5,0,0,0,3.5,6.53,8.59,2.9,9.36,12.31,1.9,2.61,3.44 
1000,-1000,-1000,0,0,0,20.76,21.78,15.66,18.48,23.44,16.96,27.72,26.46,19.92,32.28,29.58,23.08 
1000,-1000,-1000,-2.28,-6.12,-4.16,-2.28,-2.53,-1.73,0,0,0,1.92,-1.85,-1.26,1.08,-1.27,-0.86 
1000,-1000,-1000,0,0,0,6.78,7.38,5.07,6.66,8.93,6.14,8.46,8.41,5.78,9.42,10.37,7.14 
1000,-1000,-1000,0,0,0,28.8,34.28,27.86,37.2,39.64,33.32,45.6,42.76,36.63,54,45.88,40.03 
1000,-1000,-1000,0,-4.95,-3.36,0,0,0,1.8,0.59,0.4,1.2,1.85,1.27,3.72,0.17,0.11 
1000,-1000,-1000,0,0,0,27.6,19.3,13.71,32.76,23.68,17.15,37.8,20.56,14.71,22.56,27.58,21.06 
+1

あなたは「それはPythonの限界を超えた」とはどういう意味ですか?どのようなエラーが表示されますか?列挙(zip(plines1、plines2、plines3))で 'for count、(sumA、sumB、sumC)を使用することをお勧めします:' sum(sumA)+ C'などの結果をキャッシュします。すべての反復。 –

+1

'float_ABC'はリストであるので、' float_ABC = float_ABC = float_ABC.astype(np.float) '行に上記のコードが' AttributeError: 'list'オブジェクトに属性 'astype'を持たないことを期待します... –

+0

thanks @ TadhgMcDonald-Jensenの入力のために - 列挙する(zip(plines1、plines2、plines3))の 'count、(sumA、sumB、sumC)の行:'何らかの理由で私の脳に接続せず、私の分析の他の部分で - それは理にかなっています。 float_ABC行については、エントリの一部が文字列として取り込まれていたので、すべてをfloatオブジェクトに変換していました。私の最後でうまくいくようです。しかし、それについての助けには非常に感謝しています! –

答えて

0

この回答は、アルゴリズムを手伝っよりcodereviewのような質問を扱っています。

まずすることができますiterate over all three plines1 at the same time using zip

for sumA, sumB, sumC in zip(plines1, plines2, plines3): 
    pass 

いますが、enumerateを使用することができる上、その後あなたはステップの実行中のカウントを取得します

for count, (sumA, sumB, sumC) in enumerate(zip(plines1, plines2, plines3)): 
    pass 

を、私はまた、あなたが(B+adjust)/(C)(B+adjust-10)/(C)すべての反復を再計算気づきますどちらもループ内で変更されていないので、繰り返しの代わりにループの前に一度計算すると、実行時間が節約されます。

high_check = (B+adjust)/(C) 
low_check = (B+adjust-10)/(C) 

for count, (sumA, sumB, sumC) in enumerate(zip(plines1, plines2, plines3)): 

    if (low_check <= (sum(sumC)+B)/(sum(sumA)+C) <= high_check 
      and <OTHER CHECK>): 
     ... 

sum(sumA)算出(及びSUMB、SUMCため)sumA、値のタプルを表すのでunecessarily費用がかかり、かつ幾分混乱して何度も繰り返し、一度合計を計算するために、より意味をなすと取りますmatrixと呼ばれる一つの値としてタプル(sumA, sumB, sumC)OUT変化が不変の値を再計算するために必要な実行時間を減少させる場合にのみ

for count, matrix in enumerate(zip(plines1, plines2, plines3)): 
    sumA, sumB, sumC = map(sum, matrix) 
    if (low_check <= (sumC+B)/(sumA+C) <= high_check 
      and <OTHER CHECK>): 
     ... 
     OUT = np.vstack(matrix) 

は同様にのみ(sum(OUT[2])+A)/(sum(OUT[0])+C)を再計算する(図2dの組は十分に近い):

OUT_check = (sum(OUT[2])+A)/(sum(OUT[0])+C) 

for ... in ...: 

    if ( ... 
      and (sumB+A)/(sumA+C) > OUT_check): 
     ... 
     OUT_check = (sum(OUT[2])+A)/(sum(OUT[0])+C) 

ので、変更されたコードのセクションでは、このようになります。

plines1 = it.product(*Alpha) #star notation just unpacks all the elements into arguments 
plines2 = it.product(*Beta) 
plines3 = it.product(*Phi) 

high_check = (B+adjust)/(C) 
low_check = (B+adjust-10)/(C) 
OUT_check = (sum(OUT[2])+A)/(sum(OUT[0])+C) 

for count, matrix in enumerate(zip(plines1, plines2, plines3)): 
    sumA, sumB, sumC = map(sum, matrix) 
    if (low_check <= (sumC+B)/(sumA+C) <= high_check 
      and (sumB+A)/(sumA+C) > OUT_check): 
     print("#",count,"- new option found!") 
     OUT = np.vstack(matrix) 
     OUT_check = (sum(OUT[2])+A)/(sum(OUT[0])+C) 
+0

私はコードを変更して私ができる部分を列挙してキャッシュし、現在のアルゴリズムでは計算時間を節約しました。現在のアルゴリズムの最適化に感謝します。私は、さらに時間を改善することを求めていると思います。解析するデータの列を追加するために時間をさらに改善できるソルバアルゴリズムがあるかどうかです。私の究極の目標は、sample.csvに15個のアイテムを9個ではなく各タプルにインポートさせることです。これは、scipyのアルゴリズムの助けを借りて実現できますか?すべての線を反復する前に最適化しますか? –

+0

私はこれらの機能を実際に使用していないので、私はその面で手助けできません。申し訳ありません。 –