私はサンプルのオーディオファイルを持っており、それを別のオーディオファイル(オーディオファイル内の認識フラグメントの開始時間と終了時間など)で見つける必要があります。このタスクを実行するライブラリはありますか?
2
A
答えて
2
1)CMU Sphinx。音声認識用のオープンソースツールキットです。
概要CMUSphinxは、BSDスタイルのライセンスでリリースされた、スピーカーに依存しない大語彙連続音声認識プログラムです。また、オープンソースのツールとリソースの集まりであり、研究者や開発者が音声認識システムを構築できるようにします。
2)RWTH ASR(ショートRASR)は、オープンソースの音声認識ツールキットです。
概要このツールキットには、自動音声認識システムの開発のための最先端の音声認識技術が含まれています。 RWTHアーヘン大学のヒューマン・ランゲージ・テクノロジーおよびパターン認識グループによって開発されました。
3)Julius:「Julius」は、スピーチ関連の研究者や開発者向けの高性能な2パス大語彙連続音声認識(LVCSR)デコーダソフトウェアです。
私はさらに多くの結果を提供するかもしれませんが、私は上記の3つは十分以上であると思います。
+0
これら3つのすべてが見えます「スピーチ」パターンマッチングに合わせて調整されます。 "拍手"や "警察のサイレン"のパターンマッチングのような一般的な音はありますか? – Connor
関連する問題
- 1. 誰でもこのレイアウトを提案できますか?
- 2. 誰もがソースコード参照ツールを提案できますか?
- 3. PhpStorm型の認識/提案
- 4. 誰でもこのスクリプトを認識できますか?
- 5. 誰でもこの言語を認識できますか?
- 6. 誰でもasp .net UIデザインの良いガイドラインを提案できますか?
- 7. 誰も私のコードに必要な変更を提案できますか?
- 8. 誰も私のコードに必要な変更を提案できますか?
- 9. 誰かが良いイメージキャッシュライブラリを提案できますか?
- 10. 誰かがiOSクラッシュログ分析ツールを提案できますか?
- 11. 誰もhadoop、sqoop、hbase、ハイブの互換性バージョンを提案できます
- 12. 誰でもASP.Net用のタグ提案コンポーネントを持っていますか?
- 13. ラテックスで次のグラフを作成する必要があります。誰もパッケージを提案できますか?
- 14. 誰かがGoogleのガラスチュートリアルの良いリンクを提案できますか?
- 15. 誰でもこの画像フォーマットを識別できますか?
- 16. MySql、誰でも私のクエリ/インデックスを改善する方法を提案できますか?
- 17. 誰もが、シンプルで無料のバグトラッカーを提案することはできますか?
- 18. 自動提案ライブラリ
- 19. 誰もKafka Sink ConnectorのサンプルJavaを提供できますか?
- 20. 誰もジェンキンを使ってangularjsのCI/CDを行うための手順を提案できますか?
- 21. 誰でもmoQフレームワークを使用するためのステップバイステップの例を提案できます
- 22. 誰も私にどのようにリダイレクトするかを提案することができます
- 23. joomlaで電子メールでダウンロードリンクを送信するユーザーとモジュールは誰でも提案できます
- 24. 誰もPHPマニュアルの他に、ヘッダ、クッキー、セッションの優れた記事を提案できますか?
- 25. 予期せぬファイルエラーの終了、誰でも教えて/コードを提案することができます
- 26. ライブラリやフレームワークの提案?
- 27. DataTableで式を作成し、提案を提案しますか?
- 28. 私はCSS開発の提案を誰にしますか?
- 29. 深さ情報を用いた物体認識アルゴリズムの提案
- 30. 誰かがPythonの学習をどこから始めるべきなのかを提案できますか?
[オープンソースの音声パターン認識(指の印刷)]の複製が可能です。(http://stackoverflow.com/questions/6269167/open-source-audio-pattern-recognition-finger-printing) – user