私はsklearn.datasetをロードしようとしており、キー(target_names、target & DESCR)に従って列が欠落しています。最後の列を含めるにはさまざまな方法を試しましたが、エラーがあります。Pandas DataFrameにSKLearn癌データセットを読み込む
import numpy as np
import pandas as pd
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
print cancer.keys()
キーは、それだけ戻り[ 'target_names'、 'データ'、 '目標'、 'DESCR'、 'FEATURE_NAMEに']上記のコードで
data = pd.DataFrame(cancer.data, columns=[cancer.feature_names])
print data.describe()
あります私は31の列が必要なときに30列。最も良い方法は、scikit-learnデータセットをpandas DataFrameに読み込むことです。
あなたは説明できますか? 'cancer.data.shape'を使うか、[データセットの説明](http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.html)をチェックすると、30個しかないようですデータセット内の列。どの列を見逃しましたか? –
まだデータフレームにロードされていないので、dataset.keys()からtarget/target_namesカラムが抜けています。 – pythonhunter