2017-05-06 7 views
0

私は非常に新しくPythonには慣れていませんが、誰かがこれを手伝ってくれることを願っています。私はgoogleで(理解できる?)答えを見つけられませんでした。Pythonを使用してCSVファイル内の単一の列をデコードする3 Base64

複数の列を含む大きな(10GBの)CSVファイルがあります。すべての列は、1つの列を除いて人間が読むことができる「通常の」テキストです。この列はバイナリです。私はこれをデコードし、デコードされたデータをCSVファイルに書き戻したいと思います。

これは私が今までに得たものですが、私は気が遠くなっています。どんな助けもありがとう! CSVの

import base64 
import pandas as pd 



df = pd.read_csv('sample.csv', delimiter=';', 
       usecols=[3], dtype=object, header=None,) 
decoded_binary_data = base64.b64decode(df) 

print(decoded_binary_data) 

サンプル:

"5f8ebfd8-7d12-4659-a416-e5dcbe056d0a";"6";"1";**ez??R?+??a)??? 
Cs**;0;0;0;74;1720; 
  • EDITは少しCSVファイルをクリーンアップ。
  • EDITは、データフレームのサンプルデータフレーム

サンプルを追加しました:

0          ez??R?+??a)???Cs 
1      B?t?a?h?kwd?W-]\???fc?m[m?A}??? 
2      ?eE????3r??c??T????fc?m[m?A}??? 
3      ?eE????3r??c??T????fc?m[m?A}??? 
4      ?eE????3r??c??T????fc?m[m?A}??? 
5      B?t?a?h?kwd?W-]\???fc?m[m?A}??? 
+0

あなたは小さなを投稿することができますがサンプルデータセット(一部のエンコードされたデータを含む)? – MaxU

+0

健全なCSVファイルのようには見えません - 異なる行に異なる数の列があります – MaxU

+0

csvファイルはどこから来たのですか? –

答えて

関連する問題