2017-01-23 10 views
1

現在、入力を出力にマッピングできるcnnネットワークを実装しようとしています。ケラスでCNNネットワークを設定するには?

入力は音声ファイルのstftで構成され、出力は特徴ベクトルです。

オーディオファイルの長さが異なるため、合計サンプル数は常に異なりますが、各サンプルのフレーム長は25ミリ秒で10ミリ秒です。形状(x、2050)

出力は、特徴ベクトル形状は(x、13)です。

ここでは、各入力が重複のために前のサンプルの情報を含んでいるので、cnnの使用がstftとして適切だと思っていました。

ケラスでは、これを利用するモデルを設計することができますので、マトリックスの各行に畳み込み合計が計算され、何らかの形で25フレームの長さと10の重なりを認識させます。

答えて

1

はい、このファイル[1]の220行目を参照してください。これは、畳み込みを使ってKerasでWavenetを実装したものです。ラッパーレイヤーを作成したにもかかわらず、これはオーディオサンプルをモデリングする方法の直感を与えるはずです。

[1]の迅速な対応のために..私は..あなたに属していますが、実装上のビットを手の込んだことができればわからないhttps://github.com/basveeling/wavenet/blob/master/wavenet.py#L220

+1

のおかげ? –

関連する問題