私の主な目標は、フロートの巨大な行列からメジアン(列単位)を計算することです。例:Python - ファイルから列イテレータを取得する(ファイル全体を読むことなく)
a = numpy.array(([1,1,3,2,7],[4,5,8,2,3],[1,6,9,3,2]))
numpy.median(a, axis=0)
Out[38]: array([ 1., 5., 8., 2., 3.])
マトリックスは、Pythonメモリ(〜5件のテラバイト)に収まるには大きすぎるので、私はcsvファイルに保管してください。 だから私は各列を実行し、中央値を計算したいと思います。
ファイル全体を読み取らずに列イテレータを取得する方法はありますか?
マトリックスの中央値を計算する他のアイデアも良いでしょう。ありがとうございました!
参照:http://stackoverflow.com/questions/1053928/python-numpy-very-large-matrices –