2017-12-28 29 views
0

mongodbに巨大なCSVファイルデータをコピーしています。私は今、私は新しいフィールド 'タイムスタンプ':current_time(日付のcmd出力)を追加するcsvに完全に5列を持っています。MongoDBすべてのレコードに新しい/更新フィールドタイムスタンプを追加

どのようにこれを達成するための最良の方法は、mongodbに挿入する前に、またはどのように挿入するのですか?

私は、DBへの書き込みにコードの下とほぼ同様使用しています: https://gist.github.com/mprajwala/849b5909f5b881c8ce6a

何私が持っていることは次のとおりです。

A  B   C  D  E   
Jack 08/03/1865 Yes City1 Company1 
Sam 07/11/1881 Yes City2 Company1 
Lina 18/02/1990 No  City3 Company1 

私が欲しいものは次のとおりです。

A  B   C  D  E   Timestamp 
Jack 08/03/1865 Yes City1 Company1 1514446225 
Sam 07/11/1881 Yes City2 Company1 1514446225 
Lina 18/02/1990 No  City3 Company1 1514446225 

答えて

0

あなたの場合はコードはサンプルコードに基づいていますので、保存する前にdata_jsonを更新することができます(これが最善の方法だと思います)。

...  
    data = pd.read_csv(file_res) 
    data_json = json.loads(data.to_json(orient='records')) 
    for doc in data_json: 
     doc['timestamp'] = timestamp 
    db_cm.remove() 
    db_cm.insert(data_json) 
+0

各行を読み込んでから挿入するか、mongo dbに挿入する前にcsvを読み込んで別の列を追加する方が良いですか? 同じ値を持つ各行のcsvに新しい列を追加できますか? – Rachel

+0

デフォルトでは、json.loads()にtimestamp now()を追加することは可能ですが、 – Rachel

関連する問題