に重複する値を持つ行を削除します。日付を発行し、第3列に予測値ですされて、私は最初の列の第二に、日付を予測しているCSVファイルがあると仮定し、単一のカラムと古いタイムスタンプ
forecast,issued,temp
2016021700,2016021702,5.3
2016021706,2016021702,6.3
2016021712,2016021702,8.6
2016021718,2016021702,5.1
2016021700,2016021703,5.4
2016021706,2016021703,6.4
Pythonでは、私は自動的に同じ予測日と古い発行日の行を削除したいと思います。出力は、予測日に従って日付/時刻の順序でなければなりません。期待される結果は次のとおりです。
forecast,issued,temp
2016021700,2016021703,5.4
2016021706,2016021703,6.4
2016021712,2016021702,8.6
2016021718,2016021702,5.1
すべてのヘルプは〜感謝
SOLUTION:私はこの使用してパンダを解く:
import pandas as pd
df = pd.read_csv('data.csv')
df = df.drop_duplicates(subset='forecast',keep='last')
df = df.sort(['forecast'],ascending=True)
df.to_csv('out.csv',index=False)
あなた自身で試してみてください。助けが必要な場合は、ここにコードを入力してください。 –
ご意見ありがとうございます。残念ながら、私は実際にどこから始めるべきかわからず、私の努力はすべて私が期待していたものからあまりにも遠く、ここに投稿する価値はありませんでした。もし私が近づくなら私は分かち合うでしょう。この瞬間、どんな提案も役に立ちます。 – jazera