2016-09-28 6 views
0

numpy.savetxtを使用して.csvファイルを作成したいとします。ファイルの各rowは、特定のイベントを示します。すべての行には、イベントのさまざまな要素を示す複数のcolumnsがあります。各columnに格納されている情報は異なります。特定のcolumnsは、単一のfloatの値を含み、その他は、互いに接続された2つのfloatsを含む必要があります。 .csvをロードするときにその列を呼び出すと、2つのfloat値を取得する必要があります。これは、しかし、次のエラーメッセージをもたらすnumpy.savetxtで異なるカラムフォーマットを実現

import numpy 

rows = 5 
columns = 2 
save_values = numpy.zeros((rows, columns)) 

for idx in xrange(rows): 
    column_0 = float(idx) 
    column_1 = [idx + 5., idx + 15.] 

    save_values[idx, :] = column_0, column_1 

numpy.savetxt("outfile.csv", save_values, delimiter = ",") 

:理解

save_values[idx, :] = column_0, column_1 
ValueError: setting an array element with a sequence. 

私は、次のコードを持っています。しかし、なぜそれが間違っているのか分かっているにもかかわらず、私は目標を実現するのに苦労している。

どのように目標を達成できますか?

+0

numpy配列では、すべての要素が同じ型でなければなりません。つまり、最初の列を数値にすることはできず、2番目の列はnumpy配列のベクトルになります。あなたはパンダテーブルが必要です。 – user40314

+0

しかし、フィールドに異なるdtypeがある場合、[構造numpy配列](http://docs.scipy.org/doc/numpy/user/basics.rec.html)を持つことができます。 –

答えて

1

savetxtのステップにも到達していません。

save_values[idx, :] = column_0, column_1 

ターゲットは2つの値(2列)です。ソースはidxとリストです。

これが、「シーケンス付きの設定」エラーを表示する理由です。リストをsave_values[idx,1]に入れることはできません。

2つのフィールドと2つの要素を持つフィールドの1つを持つsave_valuesアレイを定義できます。しかし、どうやってそれを保存しますか?

テキストファイルはどのように表示されますか?3列は,で区切られますか? 2番目の列には特別な構造の列が2つあります。

1.2, 3.5, 4.2 # or 
1.2, [2.5, 4.2] 

これは、ロード可能なものの問題を引き起こします。 genfromtxtは3つの列を処理できます。ネストされた列を容易に渡すことはできません。デフォルトのgenfromtxtは、3列の場合を3列としますが、2つのフィールドdtypeを与えることは可能です。

とにかく、私は3列を生成するのが最も簡単だと思います。リロードは列またはフィールドで行うことができます。

私は複合DTYPE配列を生成することができます。

In [329]: dt = np.dtype('i,(2,)f') 
In [330]: dt 
Out[330]: dtype([('f0', '<i4'), ('f1', '<f4', (2,))]) 
In [331]: save_values = np.zeros((5,),dtype=dt) 
In [332]: for i in range(5): 
    ...:  save_values[i]=(i,(i+5., i+15.)) 
    ...:  
In [333]: save_values 
Out[333]: 
array([(0, [5.0, 15.0]), (1, [6.0, 16.0]), (2, [7.0, 17.0]), 
     (3, [8.0, 18.0]), (4, [9.0, 19.0])], 
     dtype=[('f0', '<i4'), ('f1', '<f4', (2,))]) 

しかし、私はそれを保存しようとする場合、私は私が書き込み形式を綴りてそれを保存することができ、エラー

In [334]: np.savetxt('test.txt',save_values,delimiter=',') 
... 
TypeError: Mismatch between array dtype ('[('f0', '<i4'), ('f1', '<f4', (2,))]') and format specifier ('%.18e,%.18e') 

を取得し、fmt%tuple(save_values[0])しかし、それは出力に[]を置く:

In [335]: np.savetxt('test.txt',save_values,fmt='%10d, %s') 
In [336]: cat test.txt 
     0, [ 5. 15.] 
     1, [ 6. 16.] 
     2, [ 7. 17.] 
     3, [ 8. 18.] 
     4, [ 9. 19.] 

私はトンを平らにすることができますビュー(ここで私は面白いものを維持するために第一フィールドの整数を維持しています)と、彼の配列DTYPE:

In [337]: dt1=np.dtype('i,f,f') 
In [338]: save_values.view(dt1) 
Out[338]: 
array([(0, 5.0, 15.0), (1, 6.0, 16.0), (2, 7.0, 17.0), (3, 8.0, 18.0), 
     (4, 9.0, 19.0)], 
     dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', '<f4')]) 

今私は3列として保存することができます:

In [340]: np.savetxt('test.txt',save_values.view(dt1),fmt='%10d, %10f, %10f') 
In [341]: cat test.txt 
     0, 5.000000, 15.000000 
     1, 6.000000, 16.000000 
     2, 7.000000, 17.000000 
     3, 8.000000, 18.000000 
     4, 9.000000, 19.000000 

と私はリロードすることができますそれはDTYPEのいずれかで:

In [342]: np.genfromtxt('test.txt',delimiter=',',dtype=dt) 
Out[342]: 
array([(0, [5.0, 15.0]), (1, [6.0, 16.0]), (2, [7.0, 17.0]), 
     (3, [8.0, 18.0]), (4, [9.0, 19.0])], 
     dtype=[('f0', '<i4'), ('f1', '<f4', (2,))]) 

In [343]: np.genfromtxt('test.txt',delimiter=',',dtype=dt1) 
Out[343]: 
array([(0, 5.0, 15.0), (1, 6.0, 16.0), (2, 7.0, 17.0), (3, 8.0, 18.0), 
     (4, 9.0, 19.0)], 
     dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', '<f4')]) 

私はまた、山車の5×3アレイとtext.txtを作成している可能性があります。

savetxtのキーポイントは、配列の行を繰り返し処理してフォーマットし、その行をファイルに書き込むことです。だからあなたの配列はで動作するように持っている:

for row in myarray: 
    print(fmt % tuple(row)) 

fmtが綴られてもよいし、単一のフィールドのフォーマット、例えばから構築することができます。

fmt = ','.join(['%10f']*3) # or 
fmt = '%10d, %10f, %10f' 

標準的なPython文字列の書式設定になります。

関連する問題