私はPythonを初めて使用しています。しかし、私のデータ処理で使用する練習で学ぶ。特定の列を処理するためにテキストファイルをインポートします。
ここに示すような形式の大きなデータファイルがあります。
行数と列数が常に不明です。この例では、2つの連続した行が示されています。
第1列は「時間」であり、第n列は識別器(第1行の「abc」)から選択される関連データです。
................
"2013年1月1日夜12時00分02秒" 228 227 15.65 15.84 14.85 14.68 14.53 13.75 12.45 12.55
"2013年1月2日0時01分03秒" 225 227 16.35 15.99 14.85 14.73 14.43 13.8 12.85 13.2
................
所望の出力as
- Column1 =時間の点で、時間差は と計算されます。
- column(n)=さらに処理されるデータは、 floatである必要があります。
私の過去の試行では、私はリストになってしまうので、どちらの列も変換できません。
過去の質問と回答を検索しようとしました。しかし、私は初心者なので、すべてを解釈できませんでした。私はあなたの迅速な助けが後で処理するように、データを列形式で読むことを期待しています。私はそれがより多くの数学的操作であるので、さらなる処理に注意を払うことができると信じています。
本当に助けていただきありがとうございます。
よろしく
Gouri
補正1:
私は以前に、必要に応じて列を抽出するコンパクトバージョンを与えるパンダを理解しました。グループからの提案後の良い学習。次のように
コードは次のようになります。
import pandas as pd
data = pd.read_csv(fp, sep='\t')
entry=[]
entry = data['u90']
print entry, '\n', entry[5]
out_file = open("out.txt", "w")
entry.to_csv(out_file)
よろしく
Gouri
これは非常に頻繁に尋ねられる質問です。たとえば、[pandas](http://pandas.pydata.org/pandas-docs/stable/io.html)を使用してデータを読んでください。 – Deusdeorum
Pythonの新機能コーディング、パンダは理解するのが少し複雑だと思われる。私はこれを私のさらなる練習のために保つつもりです。そしてこれも私の任務の一部です。したがって、簡単なコードの練習で早く解決することを楽しみにしています。とりわけ、提案に感謝します。 – Gouri
ヒューゴの提案によると、私はパンダとその非常に効率的なものを試しました。 – Gouri