スタックオーバーフローはこの質問をするのに最適な場所ではないかもしれませんが、私は助けが必要です。私はmp3ファイルを持っており、私はそのファイルからテキストを取得するためにGoogleの音声認識を使用したい。私がドキュメンテーションや例を見つけることができるアイデアは感謝します。Google音声認識APIをPythonで使用するには?
答えて
開発者がオーディオをテキストに変換できるようにするGoogle Cloud Speech APIを見てください。[...]APIは、限られた量のAPIリクエストを得るために無料のアカウントを作成できます。そして、クラウドプラットフォームコンソールで、[プロジェクト]ページに移動し、新しいプロジェクトを選択または作成します
pip install --upgrade gcloud
pip install --upgrade google-api-python-client
:あなたがしてgcloud python module & google-api-python-clientモジュールをインストールするには最初に必要
:HOW TO
。プロジェクトの請求を有効にする必要がある場合は、enable Cloud Speech API。
コードからクラウドスピーチAPIサービスに認可する方法についてはSet Up a Service Accountを参照してください
GoogleクラウドスピーチAPIを有効にした後、あなたのクラウドスピーチAPIの資格情報を設定するために資格情報]ボタンに、[移動]をクリックします
は、Googleから、download the audio raw fileをサービスアカウントキーファイル(JSON)で、あなたが一度スピーチAPI
に一切行って認証することができますGOOGLE_APPLICATION_CREDENTIALS環境変数の両方を取得して、外出先からもspeech-discovery_google_rest_v1.json必要があります色目
資格情報を設定するために、以前ダウンロードしたJSONファイルを変更し、あなたが持つ.jsonファイルのフルパスにごGOOGLE_APPLICATION_CREDENTIALS環境変数を設定していることを確認してください キー:また
export GOOGLE_APPLICATION_CREDENTIALS=/path/to/service_account_file.json
GCLOUD_PROJECT環境変数をGoogle CloudプロジェクトのIDに設定していることを確認してください。
export GCLOUD_PROJECT=your-project-id
そして、実行
import argparse
import base64
import json
from googleapiclient import discovery
import httplib2
from oauth2client.client import GoogleCredentials
DISCOVERY_URL = ('https://{api}.googleapis.com/$discovery/rest?'
'version={apiVersion}')
def get_speech_service():
credentials = GoogleCredentials.get_application_default().create_scoped(
['https://www.googleapis.com/auth/cloud-platform'])
http = httplib2.Http()
credentials.authorize(http)
return discovery.build(
'speech', 'v1beta1', http=http, discoveryServiceUrl=DISCOVERY_URL)
def main(speech_file):
"""Transcribe the given audio file.
Args:
speech_file: the name of the audio file.
"""
with open(speech_file, 'rb') as speech:
speech_content = base64.b64encode(speech.read())
service = get_speech_service()
service_request = service.speech().syncrecognize(
body={
'config': {
'encoding': 'LINEAR16', # raw 16-bit signed LE samples
'sampleRate': 16000, # 16 khz
'languageCode': 'en-US', # a BCP-47 language tag
},
'audio': {
'content': speech_content.decode('UTF-8')
}
})
response = service_request.execute()
print(json.dumps(response))
if __name__ == '__main__':
parser = argparse.ArgumentParser()
parser.add_argument(
'speech_file', help='Full path of audio file to be recognized')
args = parser.parse_args()
main(args.speech_file)
を:
すべて完了と仮定すると、あなたは含まれていtutorial.pyファイルを作成することができます
python tutorial.py audio.raw
https://cloud.google.com/speech/docs/ documentation –
https://cloud.google.com/speech/docs/samples/speech-discovery_google_rest_v1.jsonが壊れています。(404) –
正確、ありがとうございます。 https://raw.githubusercontent.com/revmischa/google-transcriber/master/speech-discovery_google_rest_v1にはまだバージョンがあります。"クライアントライブラリはAlphaとしてリリースされ、後方互換性のない方法で変更される可能性があります。クライアントライブラリは現在、運用用に推奨されていません。"、この回答は間もなく廃止される予定です... –
- 1. 音声認識Api
- 2. AppEngineのGoogleスピーチ/音声認識API?
- 3. Googleの音声認識API結果が
- 4. CMU Shinx、JSAPI、Google Speech APIを使用した音声認識
- 5. 音声ストリーム上のGoogleストリーミング音声認識Python
- 6. Googleの音声認識APIの使用制限
- 7. 、Googleの音声認識
- 8. ビデオファイルのGoogle音声認識
- 9. 音声認識音声認識 - Ionic 2
- 10. Microsoft音声認識API
- 11. C++音声認識API
- 12. iPhone音声認識API?
- 13. node.jsでBing音声認識APIを使用するSkypeでボットフレームワーク
- 14. Python音声認識とChatterbot
- 15. データストリームをGoogle音声認識(Python)に変更する方法
- 16. C#音声認識ライブラリを使用した音声UIまたは音声認識
- 17. 音声認識?
- 18. 音声認識
- 19. Google音声認識ストリーミングAPIによるカール
- 20. Google音声認識での不正なリクエストエラーC#を使用したREST API
- 21. Google Speech API - base64でエンコードされた音声を認識
- 22. アプリでGoogle音声認識を追加するには
- 23. 音声認識pythonがリッスンで停止
- 24. Google Python音声認識を起点にして
- 25. Google音声認識APIが最初に返されるのは2〜3秒間の音声テキストです。
- 26. uwp音声認識
- 27. 音声認識ツール
- 28. 音声認識ループ
- 29. C#音声認識
- 30. Skype音声認識API with node.js Botフレームワーク
をこの質問が広すぎるとオフの要求でありますスタックオーバーフローのトピックではないサイトリソース。それがまだ閉鎖されていない唯一の理由は、奨励金が添付されているためです。 – JAL
こちらをご覧ください:https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech – blambert