私はcsvファイルをPythonで解析しようとしています。各行には4つの要素がカンマで区切られています。要素は文字列ですが、カンマも含めることができます。要素にコンマが含まれる場合、その要素は二重引用符で囲まれます。次の例は、引用符でとすることなく、2つの異なる例を示します。条件付き分割文字列
http://data.europa.eu/esco/skill/CTC_43028,"use data extraction, transformation and loading tools","ETL|extract, transform, load","<div>Integrate information from multiple applications, created and maintained by various organisations, into one consistent and transparent data structure.</div>"
http://data.europa.eu/esco/skill/SCG.TS.1.4.m.2,support company plan,follow industry guidelines|follow organisation's vision|monitor policy implementation|support company mission,<div>Act within one's work role to advance the goals and vision of the organisation.</div>
私が欲しい四つの要素にそれぞれの行を分割することです。 私はPythonの分割機能を試しましたが、成功しませんでした。私は正規表現を使わなければならないと思うが、私はそれに精通していない。 いくつかの助けてもらえますか? 多くのありがとうございます。
import csv
with open('file.csv') as f:
r = csv.reader(f)
for row in r:
print row
['http...', 'transformation ...', 'ETL|ext ...', '<div>Integrate ...']
['http:...', 'support ...', 'follow ...', '<div>Act ...']
','
は、デフォルトの区切り文字と'"'
デフォルトquotecharです:
'csv'モジュールはどうですか?それはそのために作られたテーラーです。正規表現を削除してください... –