recarray

4熱

2答えて

numpy.lib.recfunctions.append_fieldsを使用して、既存の再配列に2Dフィールドを追加したいとします。再配列を作ったとしましょう。 > arr = np.recarray(10, [("afield", "<f8"), ('pos', '<f8', (3,))]) > arr.dtype dtype((numpy.record, [('afield', '<f

0熱

1答えて

頻度数（）recarray

とのコードはこのような何か行く：私がしたかった P p1 p2 Q q1 q2 q1 q2 R r1 1 1 0 0 r2 0 0 1 0 ：インデックスの再作成した後 >>>data = pd.DataFrame({'P': ['p1', 'p1', 'p2'], 'Q': ['q1', 'q2', 'q1'], 'R': ['r1', 'r

0熱

1答えて

numpy.recarray、__unicode__の問題から継承

私はnumpy.recarrayのサブクラスを作成しました。このクラスの目的は、レコード配列の機能を維持しながら、レコード配列にきれいな印刷を提供することです。ここではコードです： In [7]: TableView(x)[0] Out[7]: (22, 2, -1000000000.0, 2000.0) それは動作します：ここで import numpy as np import re

5熱

1答えて

のpythonは、構造化/ recarrayを構築するとき、私は型変換の行動によって混乱している/ recarray型変換の挙動

を構造化：この単純な例では、数値フィールドにかかりますが、文字列としてタイプを定義しています。 data = [(1.0, 2), (3.0, 4)] np.array(data, dtype=[('x', str), ('y', int)]) 生成：だから値は、あなたが期待するものではありませんこれは空の文字列に変換した array([('', 2), ('', 4)], dtype=

6熱

2答えて

numpy再配列を正規化/標準化

numpyを正規化/標準化する最良の方法は何ですか？recarrayです。これを明確にするために、私は数学的行列については言及していませんが、例えば、テキスト列（ラベルなど）。あなたが見ることができるように a = np.genfromtxt("iris.csv", delimiter=",", dtype=None) print a.shape > (150,) 、私は例えばできません

15熱

1答えて

可変長のnumpy再配列文字列

文字列の長さを事前に知らなくても、文字列を保持するnumpy再配列を初期化することはできますか？（不自然）の例としては： mydf = np.empty((numrows,), dtype=[ ('file_name','STRING'), ('file_size_MB',float) ]) 問題は、私は情報とそれを埋めるの前に私のrecarrayを構築しています、と私は必ずしも事前にfil

5熱

1答えて

再配列属性/列を取得するpython

再配列の列タイトルを取得しようとしていて、かなりの問題に遭遇しています。私はpylabのcsv2rec機能を使用して、.csvファイルを読み込む場合は、私は次のように列のタイトルにもアクセスできるようにしています：「column1のは、」最初の列のタイトルであり、それは残りの部分を返します from pylab import csv2rec x = csv2rec(file.csv) x.co

1熱

1答えて

rec2csv行間の空白行をエクスポートする

rec2csvを使用して再配列をcsvファイルにエクスポートしようとしています。後でcsv2recを使用して取得できます。問題は、rec2csvが各行間に空白行でエクスポートされているため、後でcsv2recがそれを読み取ることができないことです。関数rec2csvでこの問題を解決するにはどうすればよいですか？基本的に、私がやろうとしているが、このされていますいくつかの計算後 ticker =

5熱

1答えて

データ型（datetime、float）でnumpy再配列を作成するには？

のは、私はいくつかの単純なデータ y = [[datetime.datetime(2012,1,1,1,1), 2.1], [datetime.datetime(2012,1,1,1,2), -3.1], [datetime.datetime(2012,1,1,1,3), 0.1]] を持っていると私はそれに対応するnumpyのレコードの配列をしたいとしましょう。 np.r

0熱

1答えて

numpy再配列での効率的なGROUP BYクエリ

私は、商品購入ログのデータセットを、 purchase_date、user_address、user_id、product_id、brand_id、retailer_idという6つの列で持っています。すべては整数を含みますが、user_addressは文字列です。データセット全体で最も多くのアイテムを販売するトップ5ブランド、つまりデータに最も多くのエントリを持つブランドを取得する必要がありま