私はずっと前からmatplotlibを使用していましたが、素晴らしいですが、私はパンダに切り替えたいと思っていました。パンダを使用したCSVファイルの解析
sam,123,184,2.6,543
winter,124,284,2.6,541
summer,178,384,2.6,542
summer,165,484,2.6,544
winter,178,584,2.6,545
sam,112,684,2.6,546
zack,145,784,2.6,547
mike,110,984,2.6,548
etc.....
私は名前マイクで何のためにCSVを検索し、それを自分のリストを作成する最初たい:
私のデータセットは、次のようになります。今度はこのリストを使って、たとえば、sam[3] + winter[4]
またはsam[1]/10
を追加して、数学をやりたいと思っています。最後の部分は、列をお互いにプロットすることです。
このページを通って行く
http://pandas.pydata.org/pandas-docs/stable/io.html#io-read-csv-table
私が見る唯一の事は、私は列ヘッダを持っている場合は、しかし、私は任意のヘッダを持っていないです。私は自分が望む値の行の中の位置だけを知っています。
だから私の質問は次のとおりです。
- 私は行ごとにリストの束を作成するにはどうすれば私のCSVデータポイントの数百万人を持っている場合(SAM、冬、夏)
- は、効率的なこの方法ですか?
- パンダのデータフレームをプロットするのに、
matplotlib
プロットを使用できますか?
すなわち:
fig1 = plt.figure(figsize= (10,10))
ax = fig1.add_subplot(211)
ax.plot(mike[1], winter[3], label='Mike vs Winter speed', color = 'red')
私はちょっと混乱しています。ここでは、最初の列の値に基づいてリストを作成する方法を示します。たとえば、それに含まれるものすべてが夏ですか? –
あなたはこの 'data [data [0] == 'summer']のようなすべての' summer'sを取得します。 – burhan
ここではうまくいきませんでした.Sam = data [data [0] == 'sam' ] print(サム)、私が持っていたのは全部で10個のフィールド、15行目をスキップしたものです。 –