私は数ヶ月前に持っていなかったパンダに問題があります。私はユーザー入力(tkinterを使用)から一連のデータを取り出し、それをpandasデータフレームに入れようとしています。ここでは、データがどのように見えるかです:パンダDataFrameでデータを読み取ることができません
1.000000 03/27/2016 13:29:26.098 1431.778943 0.092089
1.000000 03/27/2016 13:29:26.298 1432.410517 0.078570
1.000000 03/27/2016 13:29:26.498 1431.905258 0.089538
1.000000 03/27/2016 13:29:26.698 1431.399999 0.080930
5.000000 03/28/2016 00:00:00.098 1289.422164 0.392945
25.000000 03/28/2016 00:00:00.298 1289.295849 0.145016
25.000000 03/28/2016 00:00:00.498 1289.295849 0.183149
25.000000 03/28/2016 00:00:00.698 1288.790590 0.175114
26.000000 03/28/2016 00:25:16.698 1302.053644 0.162170
.....
5列が設定されているが、どこかのデータセット200,000 800,000ラインの間に通常存在します。ここで
は私のコードです:
import pandas as pd
import tkinter as tk
from tkinter import filedialog
root = tk.Tk()
root.withdraw()
file_path = filedialog.askopenfilename() #User selects file
file = pd.read_table(file_path, index_col=False)
df = pd.DataFrame(data=file, columns=['Measurement', 'Date', 'Time','CO2', 'Flow'], dtype=object)
print(file_path)
print(file)
print(df)
プリント(FILE_PATH)正しいパスを出力し、印刷(ファイル)は、正しいデータの全てを示しており、プリント(DF)はこのことを示しています
Measurement Date Time CO2 Flow
0 NaN NaN NaN NaN NaN
1 NaN NaN NaN NaN NaN
2 NaN NaN NaN NaN NaN
3 NaN NaN NaN NaN NaN
4 NaN NaN NaN NaN NaN
5 NaN NaN NaN NaN NaN
6 NaN NaN NaN NaN NaN
7 NaN NaN NaN NaN NaN
8 NaN NaN NaN NaN NaN
.......
前と全く同じことをしていましたが、私が作業していたスクリプトを失い、やり直す必要がありました。以前は完全に機能しましたが、何が起こったのか分かりません。私はそれを修正するためにいくつかのことを試してみました:
- は
- 変更指数=、DTYPE =、およびpd.DataFrame
- の他のプロパティをpd.io.parsers.read_tableするpd.read_table変更ファイルにコンバート大幅
- すべてのデータポイント
私は簡単にランダムなデータセットを生成して問題なくpd.DataFrameにすることができます(私はdf2 = DataFrame(np.random.randn(10,5)columns = ['a'、 'b' 'c'、 'd'、 'e'])ipythonでは正しく表示されます。
私は同じデータを持つ数値の小さい配列を作成し、うまくいきました。私はパンダを使用したいのですが、長期的には分析が簡単になると思うからです。私は本当にそれが私が行方不明の小さな何かを願っていますが、私は何かを試してみたいので、これをしばらくの間作業してきました。
は、私はあなたが 'DF = pd.DataFrame省略することができると思います(データ=ファイル、列= [ '測定'、 '日付'、 '時間'、 'CO2を'、 '流れ']、DTYPE =オブジェクト) '、' file'は 'DataFrame'です。 – jezrael
DataFrameコンストラクタに渡したときに古いdfを効果的に再インデクシングしています.np配列を渡すと、それはうまく動作します: 'pd.DataFrame(data = file。あなたのファイルに列名がない場合は、通常、希望する名前をパラメータとして渡すこともできます(例: '' '' '' '' '' '' '' '' '' '' '' '' '' ' 'read_table'には通用しますが、通常はヘッダーは' header = None'でないことを伝えなければなりません – EdChum