私は画像に変換するPDF文書にいくつかの画像分類を行うことを検討しています。私はtensorflow inception v3 pre trained modelを使用しており、テンソルフローtutoに続いて自分のカテゴリで最後のレイヤーを再トレーニングしようとしています。私はカテゴリーごとに〜1000のトレーニング画像と4つのカテゴリーしか持っていません。私は悪くないですが、まだいくつかの作業が必要に成功した分類の90%にまで達することができる20万回の繰り返しで: Tensorflowと開始による高精細画像のトレーニングV3事前訓練モデル
問題ここでは、この事前訓練を受けたモデルは、入力のための唯一の300 * 300Pの画像を取るです。明らかに、私はドキュメントで認識しようとする機能に関わる文字をたくさん使いこなしています。
モデルの入力レイヤーを変更して、より良い解像度で画像を表示することはできますか?
自宅で簡単なモデルで、より良い結果が得られますか?
もしそうなら、そのような画像分類のモデルはどこから作り始めますか?
詳細を教えてください。 開始モデルの畳み込みブロックを再利用するかどうかは、新しいサイズに適応するためにすべてを変更する必要がありますか? 「新しいサイズに関してブロックが完全に連結されている」とはどういう意味ですか? 私はKerasを見ましたが、テンソルフローよりも少し抽象性があるようですが、私の問題に役立つかどうかは分かりません – Pdv
例を使って答えを修正しました。それが役に立てば幸い。 –