2017-11-20 8 views
-3

私は花のイメージを取得し、それを識別するアプリを作ろうとしています。機械学習で高い精度を得るデータセットの最小サイズはどれくらいですか?

私は機械学習を使うと思っていましたが、データセットを調べると、各花を最大700個まで含むデータセットしか見つかりませんでした。 良い結果を得るには十分ではないと私は理解しました。

誰かがもっと大きなデータセットを知っていますか?機械学習で高い精度を得るデータセットの最小サイズは?

MLの代わりに画像処理でそのアプリに適していることはありますか?

+1

少なくとも345341個のイメージ。あなたの最後の質問は特に興味深いです。私は "私はそうだ"と言うだろう。 –

答えて

-1

まず最初に、それぞれの花の700枚の画像で十分な結果が得られないと言っているのですか?まともなモデルには十分だと思う。

データセットの最小サイズを指定する方法はありません。十分なデータがあるかどうかを知る唯一の方法は、訓練データを訓練データとテストデータの70%〜30%に分解してから、モデルを訓練し、訓練データとテストデータに対するモデルの精度を比較することです。これが満足できるものであれば(アプリケーションに依存します)、そのアプリケーションに十分なデータがあることを意味します。以下は、解決したい同じ問題のCNNとMLPの実装のリンクです。お役に立てれば。

https://www.kaggle.com/olgabelitskaya/the-dataset-of-flower-images

関連する問題