camera = webcam; % Connect to the camera
nnet = alexnet; % Load the neural net
while true
picture = camera.snapshot; % Take a picture
picture = imresize(picture,[227,227]); % Resize the picture
label = classify(nnet, picture); % Classify the picture
image(picture); % Show the picture
title(char(label)); % Show the label
drawnow;
end
このmatlabコードはインターネットで見つかりました。それはウェブカメラからの写真とウィンドウを表示し、非常に素早く写真のもの( "キーボード"、 "ブーツル"、 "鉛筆"、 "クロック" ...)も名前を付けます。私はPythonでそれをしたいです。Python:画像内のオブジェクトを分類する
import cv2
import sys
faceCascade = cv2.CascadeClassifier("haarcascade_frontalface_default.xml")
video_capture = cv2.VideoCapture(0)
while True:
ret, frame = video_capture.read()
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
faces = faceCascade.detectMultiScale(
gray,
scaleFactor=1.1,
minNeighbors=5,
minSize=(30, 30),
flags=cv2.cv.CV_HAAR_SCALE_IMAGE
)
# Draw a rectangle around the faces
for (x, y, w, h) in faces:
cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)
cv2.imshow('Video', frame)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
これはalreay非常に似ていますが、唯一の顔を検出: は、これまでのところ、私はこれを持っています。 matlabコードはalexnetを使用しています。私はこれがimagenetデータ(http://www.image-net.org/)に基づいて事前に訓練されたネットワークだと思います。しかし、もう利用できません。 私はこれをどのようにしてPythonで行いますか?
(ここにも同様の質問がありましたが、それは4歳ですが、今はもっと新しい技術があると思います)
最初の例では、1000個のクラスから1つのオブジェクトを選択して画像全体にラベルを付けています。 2番目のクラスは、ピクチャ内のオブジェクトの唯一のクラスを検出しますが、各インスタンスの場所を含みます。 Pythonの最初の例を複製するだけでよいことを明確にできますか? 2つを組み合わせることも可能です(複数のクラスの識別されたオブジェクトの周りのボックス)が、いずれの例よりもかなり複雑になります。 –
私は "label = classify(nnet、picture);%に興味があります。画像を分類してください" pcitureのための1つの分類ラベルを得る。 – jms