2017-05-03 13 views
0

私は単にMNISTデータベース(ダウンロードしたもの)を読み込み、 分類子を訓練して、後で使用するために訓練セッションをファイルに保存しようとしています。私はそれを直接(fetch_mldataを通して)ダウンロードしようとしましたが、私のインターネットはあまりにも遅いので、データベースをexteranllyでダウンロードしようとしていますが、コードの下にエラーが表示されています。どんな助けでも大歓迎です!MNISTデータベースの読み込みに問題がある

from sklearn.externals import joblib 
from sklearn import datasets 
from skimage.feature import hog 
from sklearn.datasets import fetch_mldata 
from sklearn.svm import LinearSVC 
import numpy as np 
import mlab 
import scipy.io 

print 'fetching' 
dataset = scipy.io.loadmat('mnist-original.mat') 

print 'fetched' 
features = np.array(dataset.data, 'int16') 
labels = np.array(dataset.target, 'int') 
ist_hog_fd = [] 
for feature in features: 
    fd = hog(feature.reshape((28, 28)), orientations=9, pixels_per_cell=(14, 14), cells_per_block=(1, 1), visualise=False) 
    list_hog_fd.append(fd) 
hog_features = np.array(list_hog_fd, 'float64') 
clf=LinearSVC() 
clf.fit(hog_features,labels) 
joblib.dump(clf, "digits_cls.pkl", compress=3) 

私はそれを実行すると、私のようにエラーが表示されます。私は非常にnumpyの配列に知られているだけでなく、 ファイル.MAT処理していないよ正直に言うと

Traceback (most recent call last): 
    File "/home/samad/Red_Queen/v2(ud&ay)/scratch2.py", line 14, in <module> 
    features = np.array(dataset.data, 'int16') 
AttributeError: 'dict' object has no attribute 'data' 

答えて

0

だから時間がかかりましたが、とにかく修正が見つかりました。 代わりの「.MAT」拡張ファイルILをロードするためにscipyのダウンロードを使用して、直接データベースをダウンロードするには、自動downloderまたはこのコードを使用:

dataset = datasets.fetch_mldata("MNIST Original") 

とトリックが、私はキャッシュフォルダ に外部からダウンロードしたファイルを置いていますscikitのため、ダウンロードする必要はありません。キャッシュディレクトリへのパスは次のとおりです。

~/scikit_learn_data/mldata/ 

そして、あなたは、Google検索を通じてどこからでもオリジナルマットのファイルをダウンロードすることができます。

私はリンクを使用しましたが、atmが動作する場合と動作しない場合があります。 Link to Download

関連する問題