2015-12-17 16 views
5

私はこのエリアの相対的な初心者ですので、私はあなたの助けに感謝します。 私はmnistデータセットで遊んでいます。私はhttp://g.sweyla.com/blog/2012/mnist-numpy/からコードを取りましたが、すべての画像が特徴ベクトルになるように "画像"を2次元に変更しました。それから、データ上でPCAを実行した後、SVMを実行してスコアをチェックしました。すべてが正常に動作するようだが、私は次の警告を受けていると私はなぜわからない。データ変換警告が表示されるのはなぜですか?

私はいくつかのことを試みましたが、この警告を取り除くことはできません。助言がありますか?ここでは、完全なコードは(彼らはここにコードをコピーめちゃめちゃ少しを得たように欠けているくぼみを無視する、と思われる):助けを

import os, struct 
from array import array as pyarray 
from numpy import append, array, int8, uint8, zeros, arange 
from sklearn import svm, decomposition 
#from pylab import * 
#from matplotlib import pyplot as plt 

def load_mnist(dataset="training", digits=arange(10), path="."): 
""" 
Loads MNIST files into 3D numpy arrays 

Adapted from: http://abel.ee.ucla.edu/cvxopt/_downloads/mnist.py 
""" 

    if dataset == "training": 
     fname_img = os.path.join(path, 'train-images.idx3-ubyte') 
     fname_lbl = os.path.join(path, 'train-labels.idx1-ubyte') 
    elif dataset == "testing": 
     fname_img = os.path.join(path, 't10k-images.idx3-ubyte') 
     fname_lbl = os.path.join(path, 't10k-labels.idx1-ubyte') 
    else: 
     raise ValueError("dataset must be 'testing' or 'training'") 

    flbl = open(fname_lbl, 'rb') 
    magic_nr, size = struct.unpack(">II", flbl.read(8)) 
    lbl = pyarray("b", flbl.read()) 
    flbl.close() 

    fimg = open(fname_img, 'rb') 
    magic_nr, size, rows, cols = struct.unpack(">IIII", fimg.read(16)) 
    img = pyarray("B", fimg.read()) 
    fimg.close() 

    ind = [ k for k in range(size) if lbl[k] in digits ] 
    N = len(ind) 

    images = zeros((N, rows*cols), dtype=uint8) 
    labels = zeros((N, 1), dtype=int8) 
    for i in range(len(ind)): 
     images[i] = array(img[ ind[i]*rows*cols : (ind[i]+1)*rows*cols ]) 
     labels[i] = lbl[ind[i]] 

    return images, labels 

if __name__ == "__main__": 
    images, labels = load_mnist('training', arange(10),"path...") 
    pca = decomposition.PCA() 
    pca.fit(images) 
    pca.n_components = 200 
    images_reduced = pca.fit_transform(images) 
    lin_classifier = svm.LinearSVC() 
    lin_classifier.fit(images_reduced, labels) 
    images2, labels2 = load_mnist('testing', arange(10),"path...") 
    images2_reduced = pca.transform(images2) 
    score = lin_classifier.score(images2_reduced,labels2) 
    print score 

ありがとう!

答えて

3

私はscikit-learnがyが1次元配列であると考えます。 labels変数は2-D - labels.shapeです(N、1)。 labels.ravel()を使用するよう警告が表示され、labelsが1次元配列になり、形状が(N、)になります。
再形成も動作します:考えてみるlabels=labels.reshape((N,))
ので、スクイズを呼び出します:labels=labels.squeeze()

私はここに落とし穴はnumpyの中で、1次元配列は2-Dと異なっていることだと思いますアレイは1の次元の1つに等しい。

+0

ありがとう!何らかの理由で私は問題が "画像"配列であったと確信していました。それも考えなかった。愚かな私。とにかく、これ以上の警告はありません。 ありがとうもう一度:) – shmibloo

関連する問題