0
私がやっていることは、概念的には悪名高いNMIST分類の例に似ています。ただし、各桁はコンピュータで生成された音波です。音声数字の分類
実世界の精度を向上させるために、データに背景ノイズを追加します。
私の質問は、どのモデルがこれに最も適しているかという連続データを考慮していますか?私は畳み込みネットが動作すると仮定していますか?
私は、数パーセントのパフォーマンスポイントと引き換えに、よりシンプルなモデルを好んでおり、好ましくはScikit Learnライブラリで書かれています。