「笑い」を理解するために人工知能を訓練するには

「笑い」を会話/言葉/などとは違って検出するアプリを書いてみたいです。「笑い」を理解するために人工知能を訓練するには

私はAzureまたはAmazonで学ぶ機械にオーディオまたはビデオをストリーミングするつもりです。

プロジェクトオックスフォード、ウォルフラム・アプラ、その他多くの人が私の選択肢が何であるかを決めるのに欠けていました。

質問

検出する方法はありますが、オーディオストリームの中に「笑い」？

ステップ1：同じ長さでaudiofilesの（よりよい何千hundrets）大きなトレーニングセットを作成して私の心に入ってくる

まず最初は、このようなものになるだろう。約50％は笑いを、50％は含まれていません。

ステップ2：フィーチャエンジニアリング：mean、maxima、minima、標準偏差、分布関数、フーリエ変換などのaudiowavesを区別するフィーチャを検索します。

手順3：これらの機能を使用して、ファイルを1（笑いを含む）と0（笑いを含まない）に分けることができる分類器（例：Decision Tree/SVM/Neural Net）をトレーニングします。

ステップ4：ストリームをトレーニングセットのオーディオファイルの長さの一部に分割し、クラシファイアを使用します。

をチェックすることができます。シャザムのように聞こえる。違いは、彼らは特定の曲を探していて、笑い声のようにはっきりと発音できるものではないということです。しかし、おそらくあなたはアルゴリズムのいくつかを適応させることができます。

2017-03-23 09:53:53

答えて