私は音声処理に新しいです。だから私の無知を許してください。私は短い音声信号(10秒)を与えられ、MATLABまたはWavesuferソフトウェアを使用して手作業で注釈を付けるよう求められました。今、スピーチ信号のピッチを見つける方法は?問題を解決するための理論的リソースはありますか?私はWavesurferを使って信号のピッチ輪郭をプロットしようとしました。そうでしょうか?音声信号の手動ピッチ推定
編集1:私の研究は、私たちのデータにさまざまなピッチ検出アルゴリズムを適用し、その精度を比較しています。したがって、手動で注釈を付けたピッチが参照として機能します。
更新1:EGG(dEGG)シグナルを差別化することによりGCI(声門閉鎖法)を得、dEGGのピークはGCIである。連続する2つのGCI間の時間間隔はピッチ周期である。ピッチ周期の逆数は、ピッチ(hz)である。
UPDATE 2:SIGMAは、自動GCI検出の有名なアルゴリズムです。
ありがとうございました。
http://www.seas.ucla.edu/spapl/paper/IS110135.pdf – Dschoni
ピッチを見つけるには多くの方法がありますが、本当の疑問は「手作業で注釈を付ける」という意味です - スピーチのピッチ50Hzと500Hzの間に存在するので、最初に行うべきことは、低音をフィルターにかけて、ハーモニクスの一部を取り除くことです。単にピッチを手動で決定したいのであれば、私はSTFT(スペクトログラム)や蝸牛神経のような変形を使用することをお勧めします。 – GameOfThrows
@GameOfThrows私の仕事は、私たちのデータにさまざまなピッチ検出アルゴリズムを適用し、その精度を比較することです。したがって、手動で注釈を付けたピッチが参照として機能します。 – gokul