numpy.genfromtxt
でCSVファイルを読み込もうとしていますが、フィールドの一部がコンマを含む文字列です。文字列は引用符で囲まれていますが、numpyは引用符を単一の文字列を定義するものとして認識しません。たとえば、 't.csv' 内のデータに:numpy.genfromtxtを使用してカンマを含む文字列を含むCSVファイルを読み取る
2012, "Louisville KY", 3.5
2011, "Lexington, KY", 4.0
コード
np.genfromtxt('t.csv', delimiter=',')
はエラーを生成します。私は探しています
ValueError: Some errors were detected ! Line #2 (got 4 columns instead of 3)
データ構造は次のとおりです。
array([['2012', 'Louisville KY', '3.5'],
['2011', 'Lexington, KY', '4.0']],
dtype='|S13')
ドキュメントを見て、私はこれに対処するオプションはありません。 numpyでそれを行う方法はありますか、またはcsv
モジュールでデータを読み込んでnumpy配列に変換するだけですか?
あなたは完全なCSV形式の多くを投稿することができ、私はあなたの問題を解決する方法を知っていると思う;) –
あなたは 'に' 'からの分離文字を置き換えるあなたのcsvファイルを変更する必要があります;'たとえば... –
@SaulloCastro:私の実際のデータは非常に扱いにくく、 '; 'やあなたが考えることができる他の文字を含む文字列を持っているので、私はそれを行うことができません。これはおもちゃの例にすぎません。私が探しているのはもっと一般的な解決策です。 – CraigO