2017-05-17 6 views
0

私はcollege.csvデータセットを調べて、各列の説明統計を取得しています.2つのカテゴリの列を削除すると機能します。Scipy Stats.describe and Pandas

college = pd.read_csv("C:/Users/Temple/ISLR_Datasets/College.csv") 
from scipy import stats 
college = college.drop("Unnamed: 0", 1) 
college = college.drop("Private", 1) 

for col in college.columns: 
    desc[col] = stats.describe(college[col]) 

しかし、私はちょうど列を無視し、タクトでデータセットを維持しようとする場合には、オペランドの型エラーがスローされます。

for col in college.columns: 
    if(col!="Unnamed: 0" or col!="Private"): 
    desc[col] = stats.describe(college[col]) 

unsupported operand type(s) for /: 'str' and 'int' 

異なっやっているパンダまたはnumpyの任意のアイデア?

+0

「College.csv」データセットとは何ですか?例外が発生したときに 'col'とは何ですか? –

+0

Pythonのエラーを報告するときは、常に* complete * traceback(完全なエラーメッセージ)を含めてください。実際にどの行が例外を発生させたかを示します。 (この場合、 'stats.describe(college [col]) 'と呼んでいると思われます) –

答えて

0

問題はif conditionであり、列"Unnamed: 0"および"Private"を無視できないため、常にTrueになります。 stats.describe(college[col])は、列"Unnamed: 0""Private"に適用されます。

if col not in ["Unnamed: 0","Private"] 
+0

ありがとう、ちょっとした見落とし! – Tony

関連する問題