2013-04-04 4 views
8

標準(x、y)、(x、y、z)、または(x、y、z、t)のデータをPythonで保存する方法はありますか?PythonでXYデータを保存する標準的な方法はありますか?

私はnumpyの配列がこのようなものによく使われることを知っていますが、numpyの行列でもできると思います。

私は2つのリストを一緒に圧縮して使用するのを見ましたが、どちらの側でもnumpyを使用しています。

XY_data = zip([x for x in range(0,10)] , [y for y in range(0,10)]) 

標準はありますか?そうでない場合は、あなたの好きなものはですか、あなたが一番見たものは何ですか?

+0

あなたは、具体的空間座標、または任意のデータについて尋ねていますか? –

+0

私にとって、空間座標について聞いています。しかし、私はどちらかについての情報があれば、インターネットコミュニティは喜んで学ぶことができると確信しています。 – chase

+1

サイドノート: '[x in range(0,10)]'は単に 'range(10)'と同じです – askewchan

答えて

5

良い方法の1つはstructured arrayです。これは、配列がnumpyのすべての利点を提供しますが、便利なアクセス構造です。

あなたのnumpy配列をdtype引数に与えるために必要なのは、構造化された配列を作ることだけです。これにより、各「フィールド」に名前とタイプが与えられます。彼らは、あなたが希望する場合にも、より複雑な形状や階層を持っているが、ここで私はX-Yのデータを保持する方法を説明しますすることができます

In [175]: import numpy as np 

In [176]: x = np.random.random(10) 

In [177]: y = np.random.random(10) 

In [179]: zip(x,y) 
Out[179]: 
[(0.27432965895978034, 0.034808254176554643), 
(0.10231729328413885, 0.3311112896885462), 
(0.87724361175443311, 0.47852682944121905), 
(0.24291769332378499, 0.50691735432715967), 
(0.47583427680221879, 0.04048957803763753), 
(0.70710641602121627, 0.27331443495117813), 
(0.85878694702522784, 0.61993945461613498), 
(0.28840423235739054, 0.11954319357707233), 
(0.22084849730366296, 0.39880927226467255), 
(0.42915612628398903, 0.19197320645915561)] 

In [180]: data = np.array(zip(x,y), dtype=[('x',float),('y',float)]) 

In [181]: data['x'] 
Out[181]: 
array([ 0.27432966, 0.10231729, 0.87724361, 0.24291769, 0.47583428, 
     0.70710642, 0.85878695, 0.28840423, 0.2208485 , 0.42915613]) 

In [182]: data['y'] 
Out[182]: 
array([ 0.03480825, 0.33111129, 0.47852683, 0.50691735, 0.04048958, 
     0.27331443, 0.61993945, 0.11954319, 0.39880927, 0.19197321]) 

In [183]: data[0] 
Out[183]: (0.27432965895978034, 0.03480825417655464) 

その他は、おそらくpandasを使用することをお勧めしますが、あなたのデータは比較的単純であれば、平野numpyのが容易かもしれません。

必要に応じて階層を追加できますが、必要以上に複雑な場合があります。例えば

In [200]: t = np.arange(10) 

In [202]: dt = np.dtype([('t',int),('pos',[('x',float),('y',float)])]) 

In [203]: alldata = np.array(zip(t, zip(x,y)), dtype=dt) 

In [204]: alldata 
Out[204]: 
array([(0, (0.27432965895978034, 0.03480825417655464)), 
     (1, (0.10231729328413885, 0.3311112896885462)), 
     (2, (0.8772436117544331, 0.47852682944121905)), 
     (3, (0.242917693323785, 0.5069173543271597)), 
     (4, (0.4758342768022188, 0.04048957803763753)), 
     (5, (0.7071064160212163, 0.27331443495117813)), 
     (6, (0.8587869470252278, 0.619939454616135)), 
     (7, (0.28840423235739054, 0.11954319357707233)), 
     (8, (0.22084849730366296, 0.39880927226467255)), 
     (9, (0.429156126283989, 0.1919732064591556))], 
     dtype=[('t', '<i8'), ('pos', [('x', '<f8'), ('y', '<f8')])]) 

In [205]: alldata['t'] 
Out[205]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 

In [206]: alldata['pos'] 
Out[206]: 
array([(0.27432965895978034, 0.03480825417655464), 
     (0.10231729328413885, 0.3311112896885462), 
     (0.8772436117544331, 0.47852682944121905), 
     (0.242917693323785, 0.5069173543271597), 
     (0.4758342768022188, 0.04048957803763753), 
     (0.7071064160212163, 0.27331443495117813), 
     (0.8587869470252278, 0.619939454616135), 
     (0.28840423235739054, 0.11954319357707233), 
     (0.22084849730366296, 0.39880927226467255), 
     (0.429156126283989, 0.1919732064591556)], 
     dtype=[('x', '<f8'), ('y', '<f8')]) 

In [207]: alldata['pos']['x'] 
Out[207]: 
array([ 0.27432966, 0.10231729, 0.87724361, 0.24291769, 0.47583428, 
     0.70710642, 0.85878695, 0.28840423, 0.2208485 , 0.42915613]) 
+0

ありがとう、私は以前これを見ていませんでした。したがって、本質的に、ジッパー配列とnumpy配列の両方を使用すると、構造化配列と呼ばれる別のデータ型が作成されますか? パンダのnumpy以上の利点は何ですか? – chase

+0

私はまだパンダを使用していませんが、あなたのデータセットでさまざまなグループ分けとフィルタリングを行うためにはもう少し強力です。もしあなたが気分が悪い方法に慣れていて、それらが欠けているのを見つけたら、パンダを見てください。他の人はもちろん同意しない:) – askewchan