2017-07-18 10 views
-1

私の要件は2つのCSVファイルがあるため、両方のファイルの最後の列を比較して操作する必要があります。私は2つのCSVファイルを開くためにパンダを使用しています.2番目のCSVファイルを開いて、どの列にもアクセスしようとすると、 はエラーを返します。同じpythonプログラムで複数のcsvファイルを開くことができません

import pandas as pd1 
import pandas as pd 

# comma delimited is the default 
df = pd.read_csv("results.csv", header = 0) 

spamColumnValues=df['isSpam'].values 

df1=pd1.read_csv("compare.csv",header=0) 

spamCompareValues=df1['isSpam'].values 

エラーの取得

File "/Library/Python/2.7/site-packages/pandas/core/frame.py", line 1964, in __getitem__ 
    return self._getitem_column(key) 

    File "/Library/Python/2.7/site-packages/pandas/core/frame.py", line 1971, in _getitem_column 
    return self._get_item_cache(key) 

    File "/Library/Python/2.7/site-packages/pandas/core/generic.py", line 1645, in _get_item_cache 
    values = self._data.get(item) 

    File "/Library/Python/2.7/site-packages/pandas/core/internals.py", line 3590, in get 
    loc = self.items.get_loc(item) 

    File "/Library/Python/2.7/site-packages/pandas/core/indexes/base.py", line 2444, in get_loc 
    return self._engine.get_loc(self._maybe_cast_indexer(key)) 

    File "pandas/_libs/index.pyx", line 132, in pandas._libs.index.IndexEngine.get_loc (pandas/_libs/index.c:5280) 

    File "pandas/_libs/index.pyx", line 154, in pandas._libs.index.IndexEngine.get_loc (pandas/_libs/index.c:5126) 

    File "pandas/_libs/hashtable_class_helper.pxi", line 1210, in pandas._libs.hashtable.PyObjectHashTable.get_item (pandas/_libs/hashtable.c:20523) 

    File "pandas/_libs/hashtable_class_helper.pxi", line 1218, in pandas._libs.hashtable.PyObjectHashTable.get_item (pandas/_libs/hashtable.c:20477) 

KeyError: 'isSpam' 

は誰もが私の間違いを指摘することができ、またはパンダでこれを行うことはできませんか?

どちらのCSVファイルは

https://drive.google.com/file/d/0B3XlF206d5UrUENtZlcwd0pVLW8/view?usp=sharing問題は、あなたがcompare.csvに "isSpam" という名前の列を持っていないです

https://drive.google.com/file/d/0B3XlF206d5UrbGdJRFM5TURmejQ/view?usp=sharing

+0

列との最初の列を追加します。両方の名前を.csvの – jacoblaw

+1

別名で「パンダ」を2回インポートするのはなぜですか? –

答えて

3

で見つけることができます。列は同じように見えるので、

df1=pd1.read_csv("compare.csv",header=None) 

と:あなたはそうしないと、ヘッダーとして最初の観測をキャプチャすることがあります pd.read_csv()header=Noneを渡す必要があります

df1.columns = df.columns 
+0

真剣に? downvote?これについてのフィードバックを聞くのが大好きです。 –

関連する問題