私はcsvファイルに行があり、各行は(@)で始まり、行内のすべてのフィールドは(;)で区切られています。 "Text"( "" [] "")を含むフィールドの1つには、csvファイル全体を読み込んでエクセルまたはアクセスする際にエラーが発生する改行があります。改行後のテキストは、テーブルの構造に従わずに独立した行と見なされます。csvファイルの改行を取り除く
@4627289301; Lima, Peru; 490; 835551022915420161; Sat Feb 25 18:04:22 +0000 2017; ""[OJO!
la premiacin de los #Oscar, nuestros amigos de @cinencuentro revisan las categoras.
+info: co/plHcfSIfn8]""; 0
@624974422; None; 114; 835551038581137416; Sat Feb 25 18:04:26 +0000 2017; ""[Porque nunca dejamos de amar]""; 0
これはPythonスクリプトを使用して任意のヘルプですか?
@4627289301; Lima, Peru; 490; 835551022915420161; Sat Feb 25 18:04:22 +0000 2017; ""[OJO! la premiacin de los #Oscar, nuestros amigos de @cinencuentro revisan las categoras. +info: co/plHcfSIfn8]""; 0
@624974422; None; 114; 835551038581137416; Sat Feb 25 18:04:26 +0000 2017; ""[Porque nunca dejamos de amar]""; 0
任意のヘルプ:または他のソリューションは...
出力として、私はラインを持っていると思いますか?私はcsvファイル(54MB)に改行のある行がたくさんあります。他の行はokです...
また、コメント内の@は考慮されていませんか? –
すべての行を例の2行目として構造化したい(@ 624914422 ...) – luisec
何か試しましたか?かなり簡単な方法があるようです。それを行単位で読み込み、 '@'を破棄し、 ';'で分割するか、またはcsvモジュールを使用します。 –