0
私は非常に新しくPythonには慣れていませんが、誰かがこれを手伝ってくれることを願っています。私はgoogleで(理解できる?)答えを見つけられませんでした。Pythonを使用してCSVファイル内の単一の列をデコードする3 Base64
複数の列を含む大きな(10GBの)CSVファイルがあります。すべての列は、1つの列を除いて人間が読むことができる「通常の」テキストです。この列はバイナリです。私はこれをデコードし、デコードされたデータをCSVファイルに書き戻したいと思います。
これは私が今までに得たものですが、私は気が遠くなっています。どんな助けもありがとう! CSVの
import base64
import pandas as pd
df = pd.read_csv('sample.csv', delimiter=';',
usecols=[3], dtype=object, header=None,)
decoded_binary_data = base64.b64decode(df)
print(decoded_binary_data)
サンプル:
"5f8ebfd8-7d12-4659-a416-e5dcbe056d0a";"6";"1";**ez??R?+??a)???
Cs**;0;0;0;74;1720;
- EDITは少しCSVファイルをクリーンアップ。
- EDITは、データフレームのサンプルデータフレーム
サンプルを追加しました:
0 ez??R?+??a)???Cs
1 B?t?a?h?kwd?W-]\???fc?m[m?A}???
2 ?eE????3r??c??T????fc?m[m?A}???
3 ?eE????3r??c??T????fc?m[m?A}???
4 ?eE????3r??c??T????fc?m[m?A}???
5 B?t?a?h?kwd?W-]\???fc?m[m?A}???
あなたは小さなを投稿することができますがサンプルデータセット(一部のエンコードされたデータを含む)? – MaxU
健全なCSVファイルのようには見えません - 異なる行に異なる数の列があります – MaxU
csvファイルはどこから来たのですか? –