サウンドクリップの特定の領域に関連するサンプルバイトデータをサウンドクリップの単語のように抽出して、特定の単語にのみ関連するサンプルデータの収集。それはFFTで送信できます。サウンドファイル全体に存在するバイトのコレクションから、このデータのコレクションをどのように特定することができますか?ファイルからのバイトデータの一部は、16ビットのサウンドファイル(44100Hz 15秒)のため2バイト値に変換した後、このようになります。サウンドファイルの特定の部分のみに関連するサンプルデータを検出する
49150.0
43010.0
15622.0
58886.0
19460.0
35583.0
0.0
7930.0
507.0
2303.0
59897.0
39419.0
517.0
6663.0
9989.0
13055.0
9210.0
私は、このデータは、時間領域であると私は沈黙を識別するために、0のコレクションのようなデータに重要な変更を見ていないだと認識しています。時間領域でこれを行うことができるか、またはこのデータを周波数領域に取り込んで不要なデータをフィルタリングし、逆FFTを実行して意味のあるデータの集合を得る必要がありますか?前もって感謝します。
ありがとうございました。これは学術的な割り当てのためのものです。音を発する可能性が最も高い部分を特定することさえできません。その少数のサンプル値しか抽出できません。 – user1114638