現在、入力を出力にマッピングできるcnnネットワークを実装しようとしています。ケラスでCNNネットワークを設定するには?
入力は音声ファイルのstftで構成され、出力は特徴ベクトルです。
オーディオファイルの長さが異なるため、合計サンプル数は常に異なりますが、各サンプルのフレーム長は25ミリ秒で10ミリ秒です。形状(x、2050)
出力は、特徴ベクトル形状は(x、13)です。
ここでは、各入力が重複のために前のサンプルの情報を含んでいるので、cnnの使用がstftとして適切だと思っていました。
ケラスでは、これを利用するモデルを設計することができますので、マトリックスの各行に畳み込み合計が計算され、何らかの形で25フレームの長さと10の重なりを認識させます。
のおかげ? –