recarray

    4

    2答えて

    numpy.lib.recfunctions.append_fieldsを使用して、既存の再配列に2Dフィールドを追加したいとします。 再配列を作ったとしましょう。 > arr = np.recarray(10, [("afield", "<f8"), ('pos', '<f8', (3,))]) > arr.dtype dtype((numpy.record, [('afield', '<f

    0

    1答えて

    とのコードはこのような何か行く:私がしたかった P p1 p2 Q q1 q2 q1 q2 R r1 1 1 0 0 r2 0 0 1 0 :インデックスの再作成した後 >>>data = pd.DataFrame({'P': ['p1', 'p1', 'p2'], 'Q': ['q1', 'q2', 'q1'], 'R': ['r1', 'r

    0

    1答えて

    私はnumpy.recarrayのサブクラスを作成しました。このクラスの目的は、レコード配列の機能を維持しながら、レコード配列にきれいな印刷を提供することです。ここで はコードです: In [7]: TableView(x)[0] Out[7]: (22, 2, -1000000000.0, 2000.0) それは動作します:ここで import numpy as np import re

    5

    1答えて

    を構造化: この単純な例では、数値フィールドにかかりますが、文字列としてタイプを定義しています。 data = [(1.0, 2), (3.0, 4)] np.array(data, dtype=[('x', str), ('y', int)]) 生成 :だから値は、あなたが期待するものではありませんこれは空の文字列に変換した array([('', 2), ('', 4)], dtype=

    6

    2答えて

    numpyを正規化/標準化する最良の方法は何ですか?recarrayです。 これを明確にするために、私は数学的行列については言及していませんが、例えば、テキスト列(ラベルなど)。あなたが見ることができるように a = np.genfromtxt("iris.csv", delimiter=",", dtype=None) print a.shape > (150,) 、私は例えばできません

    15

    1答えて

    文字列の長さを事前に知らなくても、文字列を保持するnumpy再配列を初期化することはできますか? (不自然)の例としては: mydf = np.empty((numrows,), dtype=[ ('file_name','STRING'), ('file_size_MB',float) ]) 問題は、私は情報とそれを埋めるの前に私のrecarrayを構築しています、と私は必ずしも事前にfil

    5

    1答えて

    再配列の列タイトルを取得しようとしていて、かなりの問題に遭遇しています。私はpylabのcsv2rec機能を使用して、.csvファイルを読み込む場合は、私は次のように列のタイトルにもアクセスできるようにしています:「column1のは、」最初の列のタイトルであり、それは残りの部分を返します from pylab import csv2rec x = csv2rec(file.csv) x.co

    1

    1答えて

    rec2csvを使用して再配列をcsvファイルにエクスポートしようとしています。後でcsv2recを使用して取得できます。問題は、rec2csvが各行間に空白行でエクスポートされているため、後でcsv2recがそれを読み取ることができないことです。関数rec2csvでこの問題を解決するにはどうすればよいですか? 基本的に、私がやろうとしているが、このされていますいくつかの計算後 ticker =

    5

    1答えて

    のは、私はいくつかの単純なデータ y = [[datetime.datetime(2012,1,1,1,1), 2.1], [datetime.datetime(2012,1,1,1,2), -3.1], [datetime.datetime(2012,1,1,1,3), 0.1]] を持っていると私はそれに対応するnumpyのレコードの配列をしたいとしましょう。 np.r

    0

    1答えて

    私は、商品購入ログのデータセットを、 purchase_date、user_address、user_id、product_id、brand_id、retailer_idという6つの列で持っています。 すべては整数を含みますが、user_addressは文字列です。 データセット全体で最も多くのアイテムを販売するトップ5ブランド、つまりデータに最も多くのエントリを持つブランドを取得する必要がありま