2012-01-08 6 views
0

サウンドクリップの特定の領域に関連するサンプルバイトデータをサウンドクリップの単語のように抽出して、特定の単語にのみ関連するサンプルデータの収集。それはFFTで送信できます。サウンドファイル全体に存在するバイトのコレクションから、このデータのコレクションをどのように特定することができますか?ファイルからのバイトデータの一部は、16ビットのサウンドファイル(44100Hz 15秒)のため2バイト値に変換した後、このようになります。サウンドファイルの特定の部分のみに関連するサンプルデータを検出する

49150.0 
43010.0 
15622.0 
58886.0 
19460.0 
35583.0 
0.0 
7930.0 
507.0 
2303.0 
59897.0 
39419.0 
517.0 
6663.0 
9989.0 
13055.0 
9210.0 

私は、このデータは、時間領域であると私は沈黙を識別するために、0のコレクションのようなデータに重要な変更を見ていないだと認識しています。時間領域でこれを行うことができるか、またはこのデータを周波数領域に取り込んで不要なデータをフィルタリングし、逆FFTを実行して意味のあるデータの集合を得る必要がありますか?前もって感謝します。

答えて

1

これを行う1つの方法は、サウンドファイルをオーディオ編集アプリケーションにロードして、選択範囲の開始点と終了点を設定し、選択点を聞いて移動するだけですあなたは欲しい。ソフトウェアアルゴリズムで使用可能なエンドポイントの正確で堅牢な記述を見つけようとするのははるかに難しい問題です。

+0

ありがとうございました。これは学術的な割り当てのためのものです。音を発する可能性が最も高い部分を特定することさえできません。その少数のサンプル値しか抽出できません。 – user1114638

関連する問題