Python：画像内のオブジェクトを分類する

camera = webcam; % Connect to the camera 
nnet = alexnet; % Load the neural net 

while true 
    picture = camera.snapshot;    % Take a picture  
    picture = imresize(picture,[227,227]); % Resize the picture 

    label = classify(nnet, picture);  % Classify the picture 

    image(picture);  % Show the picture 
    title(char(label)); % Show the label 
    drawnow; 
end

このmatlabコードはインターネットで見つかりました。それはウェブカメラからの写真とウィンドウを表示し、非常に素早く写真のもの（ "キーボード"、 "ブーツル"、 "鉛筆"、 "クロック" ...）も名前を付けます。私はPythonでそれをしたいです。Python：画像内のオブジェクトを分類する

import cv2 
import sys 
faceCascade = cv2.CascadeClassifier("haarcascade_frontalface_default.xml") 
video_capture = cv2.VideoCapture(0) 

while True: 
    ret, frame = video_capture.read() 
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) 

    faces = faceCascade.detectMultiScale(
     gray, 
     scaleFactor=1.1, 
     minNeighbors=5, 
     minSize=(30, 30), 
     flags=cv2.cv.CV_HAAR_SCALE_IMAGE 
    ) 

    # Draw a rectangle around the faces 
    for (x, y, w, h) in faces: 
     cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2) 
    cv2.imshow('Video', frame) 

    if cv2.waitKey(1) & 0xFF == ord('q'): 
     break

これはalreay非常に似ていますが、唯一の顔を検出：は、これまでのところ、私はこれを持っています。 matlabコードはalexnetを使用しています。私はこれがimagenetデータ（http://www.image-net.org/）に基づいて事前に訓練されたネットワークだと思います。しかし、もう利用できません。私はこれをどのようにしてPythonで行いますか？

（ここにも同様の質問がありましたが、それは4歳ですが、今はもっと新しい技術があると思います）

出典

2017-05-28 jms

最初の例では、1000個のクラスから1つのオブジェクトを選択して画像全体にラベルを付けています。 2番目のクラスは、ピクチャ内のオブジェクトの唯一のクラスを検出しますが、各インスタンスの場所を含みます。 Pythonの最初の例を複製するだけでよいことを明確にできますか？ 2つを組み合わせることも可能です（複数のクラスの識別されたオブジェクトの周りのボックス）が、いずれの例よりもかなり複雑になります。 –

私は "label = classify（nnet、picture）;％に興味があります。画像を分類してください" pcitureのための1つの分類ラベルを得る。 – jms

"tensorflow"パッケージと事前に訓練されたネットワーク "vgg16"を使用することで解決策は非常に簡単です。参照https://github.com/machrisaa/tensorflow-vgg/blob/master/test_vgg16.py

出典

2017-05-31 14:01:25 jms

Python：画像内のオブジェクトを分類する

答えて

関連する問題