私は本の例を次の通りですPython for Data Analysis。具体的には、2012年選挙データベースの第9章を参照してください。データはカンマ区切りの大きなcsvファイルにあります。しかし、ファイルのすべての行に余分な末尾の区切り文字があり、これは混乱するようです。pandas.read_csv
python pandas - 末尾の区切り文字は混乱しますread_csv
余分な区切り文字を余分な列があるかのように扱います。したがって、ヘッダーに必要なものよりも1つ多くの列があります。次にpandas.read_csv
は、最初の列を行ラベルとして取ります。全体の効果は、列とヘッダーがもう整列していないことです。最初の列は行ラベルになり、2列目は最初のヘッダーなどによって名前が付けられます。
かなり迷惑です。どのようにpandas.read_csv
正しいことを行うにはどのようなアイデアを教えて?私は1つを見つけることができませんでした。
素晴らしい本、BTW。
この本のギブスレポがあります。ありがとう、ウェス。 – edwardw
私はこの問題が他の場所で発生するのはちょっとだけです。 NOAA Climateサイトから気象データをダウンロードしました。各CSVファイルの末尾に余分なカンマがあります。私は上記の同じ回避策を思いつきました。それは迷惑で、read_csv()がうまくいかない理由を理解するためにしばらく時間がかかりました。 – user2072880