computer-vision

-1熱

1答えて

私は現在、1000のカテゴリのセットから画像を分類する、事前にトレーニングされたMobileNetモデルで作業しています。私のIOSアプリケーションの目的のために、私はそれをシーン内のあるタイプのオブジェクトを認識/分類する必要があります。どのようにしてモデルを訓練すれば、私が必要とするオブジェクトを分類するだけですが、それは非常にうまくいきますか？私は機械学習に慣れておらず、伝達学習テクニック

-6熱

1答えて

opencv C++エッジ検出は、その上端が白で下端が黒であることを検出します。

私はopencvの新しい学習者です。今ではいくつかのカードのような画像を扱いたいと思っています。下端の下端が黒で上端が白であること、opencvはこのようなエッジを見つける方法を持っていますか？

0熱

1答えて

Pythonは

私は https://github.com/tkarras/progressive_growing_of_gans/blob/master/h5tool.pyは、私が上記のスクリプト用のライブラリの必要なバージョンをインストールしたPythonスクリプトを実行するために私のpythonの内側に2.7仮想環境をlibjpeg8dライブラリ（http://archive.linuxfromscratc

2熱

1答えて

Facenet：顔埋め込みセットのアンサンブルの使用

Facenetは顔認識の深い学習モデルです。フィーチャを抽出するために、すなわち埋め込みと呼ばれる固定長ベクトルによってイメージを表現するために訓練される。訓練の後、与えられた各画像について、2番目の最後の層の出力をその特徴ベクトルとしてとる。その後、特徴およびある距離関数（例えば、ユークリッド距離）に基づいて、（2つの画像が同じ人であるかどうかを確認する）検証を行うことができる。三重項損失は、

0熱

1答えて

LFWでFaceNet埋め込みを評価するにはどうすればよいですか？

lfwデータセットでモデルを評価できるスクリプトを作成しようとしています。プロセスとして、（LFWアノテーションリストを使用して）イメージのペアを読み込み、顔を追跡してトリミングし、それを整列させ、事前にトレーニングされたfacenetモデル（テンソルフローを使用して.pb）に渡し、フィーチャを抽出します。特徴ベクトルサイズ=（1,128）であり、入力画像は（160,160）である。検証タスクを

-4熱

1答えて

iOSデバイスのYOLOのパフォーマンスですか？

誰もがYOLOを使用しましたか？iOSデバイスでのリアルタイムオブジェクト検出？利用可能なパフォーマンス指標はありますか？

0熱

1答えて

opencvで滑らかな画像の穴を補間する方法は？

私は別の光条件とはかなりスムーズイメージがあります。をそして私は正しく穴を埋めるために必要があります。編集：私は双線形補間を使用します。でも、どうすればが正しくになりますか？何interpolaion方法は最適とどのように適切はそれを使用しています。

0熱

1答えて

カメラ翻訳（ステッチング用）のホモグラフィ

私は少し問題があります。私は2つのキャプチャとそれを取るカメラの魔女があります。 1枚の画像に2枚の画像を再構成したい。私は、平面のテレビ画面の画像を撮影するカメラとの翻訳のみ行います。ホモグラフィは、カメラが回転をしたときにのみ動作すると聞きました。私は翻訳だけを持っているときはどうしたらいいですか？ありがとうございます。

0熱

2答えて

画像内のオブジェクトではなく、特定の画像を認識します

iPhoneカメラを使用して特定の画像を認識する必要があります。私の目標は、カメラの前に印刷物や他のディスプレイが存在するときに、その画像を認識するように、20枚の画像を設定することです。クラシファイア（CoreML）を使用することを考えましたが、意図した結果が得られないと思います。たとえば、果物を認識するモデルがあり、それにバナナの2つの異なる写真を示したら、両方ともバナナと認識しますが、これ

-1熱

1答えて

データ入力の自動化

私は手で記入されている事前定義されたフォームからのデータ入力を自動化するために探しています。文字は区切られていませんが、フィールドは表の下または表の一部として識別できます。手書きのOCRは依然として活発な研究の領域であり、私はオペレータレビュー機能を含めることができるので、90％を超える確度は期待していません。私が考えた最初の解決策は、フィールド識別用のOpenCV（http://answers