サウンドファイルの特定の部分のみに関連するサンプルデータを検出する

サウンドクリップの特定の領域に関連するサンプルバイトデータをサウンドクリップの単語のように抽出して、特定の単語にのみ関連するサンプルデータの収集。それはFFTで送信できます。サウンドファイル全体に存在するバイトのコレクションから、このデータのコレクションをどのように特定することができますか？ファイルからのバイトデータの一部は、16ビットのサウンドファイル（44100Hz 15秒）のため2バイト値に変換した後、このようになります。サウンドファイルの特定の部分のみに関連するサンプルデータを検出する

私は、このデータは、時間領域であると私は沈黙を識別するために、0のコレクションのようなデータに重要な変更を見ていないだと認識しています。時間領域でこれを行うことができるか、またはこのデータを周波数領域に取り込んで不要なデータをフィルタリングし、逆FFTを実行して意味のあるデータの集合を得る必要がありますか？前もって感謝します。

出典

2012-01-08 user1114638