SpeechRecognizerをより高速にすることは可能ですか？

私はアンドロイドSpeechRecognizerを使用しているアプリケーションを開発しています。私はそれを何かのために使っています。私はボタンをクリックすると、私のSpeechRecognizerがリスニングを開始し、私が言ったことからいくつかの結果が得られました。SpeechRecognizerをより高速にすることは可能ですか？

簡単右ですか？まあ、私の問題は、SpeechRecognizerを高速化する必要があることです。つまり、私のボタンをクリックすると「Hello」と言い、SpeechRecognizerは3〜4秒かかると考えられる結果の配列を返します。私の質問は次のとおりです。

SpeechRecognizerが結果をより速く返すようにすることは可能ですか？リスニングインテントを閉じて聞く内容を処理する時間が短くなりますか？これを行う別の方法は？これはこれよりも優れたパフォーマンスを持つでしょうか？

私はライブラリをチェックしていたし、私は、この3つのパラメータを見ました：

EXTRA_SPEECH_INPUT_MINIMUM_LENGTH_MILLIS：

それは我々が入力完了し検討するスピーチを聞いて停止した後に取るべきであるとの時間。

EXTRA_SPEECH_INPUT_COMPLETE_SILENCE_LENGTH_MILLIS

発話の最小の長さ。

EXTRA_SPEECH_INPUT_POSSIBLY_COMPLETE_SILENCE_LENGTH_MILLIS

我々はに話を聞いて停止入力は、おそらく完全に検討した後、それは取るべき時間の量。

http://developer.android.com/intl/es/reference/android/speech/RecognizerIntent.html

私はそれらのすべてを試してみましたが、それは動作していない、または多分私はrigthそれらを使用していませんよ。ここに私のコードです：

public class MainActivity extends Activity { 
private static final String TIME_FORMAT = "%02d:%02d:%02d"; 
private final String TAG = "MainActivity"; 

private StartTimerButton mSpeakButton; 
private CircleProgressBar mCountdownProgressBar; 
private CountDownTimer mCountDownTimer; 
private TextView mTimer; 
private int mRunSeconds = 0; 
private SpeechRecognizer mSpeechRecognizer; 
private Intent mSpeechRecognizerIntent; 
private boolean mIsListening = false; 

@Override 
protected void onCreate(Bundle savedInstanceState) { 
    super.onCreate(savedInstanceState); 
    setContentView(R.layout.activity_main); 
    mRunSeconds = 0; 
    mTimer = (TextView) findViewById(R.id.timerText); 
    mCountdownProgressBar = (CircleProgressBar) findViewById(R.id.progressBar); 
    mSpeechRecognizer = SpeechRecognizer.createSpeechRecognizer(this); 
    mSpeechRecognizerIntent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); 
    mSpeechRecognizerIntent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, 
      RecognizerIntent.LANGUAGE_MODEL_FREE_FORM); 
    mSpeechRecognizerIntent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE, 
      this.getPackageName()); 

//   mSpeechRecognizerIntent.putExtra(RecognizerIntent.EXTRA_SPEECH_INPUT_MINIMUM_LENGTH_MILLIS, 
//    1000); 
//  mSpeechRecognizerIntent.putExtra(RecognizerIntent.EXTRA_SPEECH_INPUT_COMPLETE_SILENCE_LENGTH_MILLIS, 
//    1000); 
//  mSpeechRecognizerIntent.putExtra(RecognizerIntent.EXTRA_SPEECH_INPUT_POSSIBLY_COMPLETE_SILENCE_LENGTH_MILLIS, 
//    1000); 

    SpeechRecognitionListener listener = new SpeechRecognitionListener(); 
    mSpeechRecognizer.setRecognitionListener(listener); 
    mSpeakButton = (StartTimerButton) findViewById(R.id.btnSpeak); 
    mSpeakButton.setReadyState(false); 
    mSpeakButton.setOnClickListener(new View.OnClickListener() { 

     @Override 
     public void onClick(View v) { 
      if (mSpeakButton.isReady()) { 
       if (!mIsListening) 
        mSpeechRecognizer.startListening(mSpeechRecognizerIntent); 
      } else 
       mSpeakButton.setReadyState(true); 
     } 
    }); 

}  

@Override 
public boolean onCreateOptionsMenu(Menu menu) { 
    // Inflate the menu; this adds items to the action bar if it is present. 
    return true; 
} 

public void onSpeechResults(ArrayList<String> matches) { 
    for (String match : matches) { 

     match = match.toLowerCase(); 
     Log.d(TAG, "Got speech: " + match); 

     if (match.contains("go")) { 
      //Do Something 
      mSpeechRecognizer.stopListening(); 
     } 
     if (match.contains("stop")) { 
      //Do Something 
      mSpeechRecognizer.stopListening(); 
     } 
    } 
} 

protected class SpeechRecognitionListener implements RecognitionListener 
{ 

    @Override 
    public void onBeginningOfSpeech() 
    { 
     //Log.d(TAG, "onBeginingOfSpeech"); 
    } 

    @Override 
    public void onBufferReceived(byte[] buffer) 
    { 

    } 

    @Override 
    public void onEndOfSpeech() 
    { 
     //Log.d(TAG, "onEndOfSpeech"); 
    } 

    @Override 
    public void onError(int error) 
    { 
     mSpeechRecognizer.startListening(mSpeechRecognizerIntent); 

     //Log.d(TAG, "error = " + error); 
    } 

    @Override 
    public void onEvent(int eventType, Bundle params) 
    { 

    } 

    @Override 
    public void onPartialResults(Bundle partialResults) 
    { 
     ArrayList<String> matches = partialResults.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION); 
     for (String match : matches) { 
      match = match.toLowerCase(); 
      Log.d(TAG, "onPartialResults : " + match); 
     } 
    } 

    @Override 
    public void onReadyForSpeech(Bundle params) 
    { 
     Log.d(TAG, "onReadyForSpeech"); //$NON-NLS-1$ 
    } 

    @Override 
    public void onResults(Bundle results) 
    { 
     //Log.d(TAG, "onResults"); //$NON-NLS-1$ 
     ArrayList<String> matches = results.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION); 
     onSpeechResults(matches); 
     // matches are the return values of speech recognition engine 
     // Use these values for whatever you wish to do 
    } 

    @Override 
    public void onRmsChanged(float rmsdB) 
    { 
    } 
}}

ありがとうございました！誰かが私を少し助けてくれることを願っています：P！

出典

2016-04-29 Francisco Durdin Garcia

いいえ、あなたは私に私が使用することができ、他の認識装置に関するいくつかのアドバイスを与えることができ、より柔軟な認識装置 –

の使用を検討？ –

はい、シャットダウンまでの遅延を低減することが可能です....

あなたは、Googleがユーザー話すの終わりに無音部分であると考えている時間の量を変更することはできません。これらのパラメータは散発的に動作しているように見えるか、まったく動作しないように見えるようになりました。

あなたができることは、部分的な結果を使用して、必要な単語やフレーズを検出し、手動で認識サービスをシャットダウンすることです。ここで

はこれを行う方法の例です：あなたは、このメソッドを実行します

public boolean isHelloDetected(@NonNull final Context ctx, @NonNull final Locale loc, @NonNull final Bundle results) { 

     boolean helloDetected = false; 

     if (!results.isEmpty()) { 

      final String hello = ctx.getString(R.string.hello); 

      final ArrayList<String> partialData = results.getStringArrayList(SpeechRecognizer.RESULTS_RECOGNITION); 

       /* handles empty string bug */ 
      if (partialData != null && !partialData.isEmpty()) { 
       partialData.removeAll(Collections.singleton("")); 

       if (!partialData.isEmpty()) { 
        final ListIterator<String> itr = partialData.listIterator(); 

        String vd; 
        while (itr.hasNext()) { 
         vd = itr.next().toLowerCase(loc).trim(); 

         if (vd.startsWith(hello)) { 
          helloDetected = true; 
          break; 
         } 
        } 
       } 
      } 

      if (!helloDetected) { 
       final ArrayList<String> unstableData = results.getStringArrayList("android.speech.extra.UNSTABLE_TEXT"); 

        /* handles empty string bug */ 
       if (unstableData != null && !unstableData.isEmpty()) { 
        unstableData.removeAll(Collections.singleton("")); 

        if (!unstableData.isEmpty()) { 
         final ListIterator<String> itr = unstableData.listIterator(); 

         String vd; 
         while (itr.hasNext()) { 
          vd = itr.next().toLowerCase(loc).trim(); 

          if (vd.startsWith(hello)) { 
           helloDetected = true; 
           break; 
          } 
         } 
        } 
       } 
      } 
     } 

     return helloDetected; 
    }

真が返された場合は、onPartialResults()

から受け取るたびに、あなたがメインでstopListening()を呼び出す必要がありますスレッド（恐らく、new Handler(Looper.getMainLooper()).post(...

認識ツールをシャットダウンした後に、onResults()で受け取った後続の最終結果はではありませんには「hello」が含まれています。その言葉は不安定なものとして分類されるだけかもしれません。

detectHello()を使用しないようにするロジックを追加する必要があります（そうでなければ、stopListening()を繰り返し呼び出します）。いくつかの単純なブールマーカーがこれを解決します。

最後に、空の文字列を削除するのにCollections.singleton("")を使用すると、内部のバグレポートdetails to replicate hereの一部となり、ListIteratorの使用はあなたのサンプルだけでは過剰です。単純なforループで十分です。

幸運。

出典

2016-05-04 16:22:42 brandall

こんにちは@brandall！私はすでに昨日、私の意図に "EXTRA_PARTIAL_RESULTS"を追加しました。私はちょうど特定の単語をキャッチしたいので、それは正常に動作します。とにかく、「EXTRA_SPEECH_ *」はどういう意味ですか？あなたはもう少し詳しく教えてもらえますか？ただ、私はあなたが私と同じ解決策を見つけ、正しい原因としてあなたasnwerをマーク私の解決策を改善しようとします！ありがとうございました。 Btw、オーディオストリームをミュートしないでビープ音をミュートすることが可能かどうかを知っていますか？ –

うれしいことですが、上記の例では、不安定な部分的な結果を使用すると、処理が速くなる可能性があります。 'EXTRA_SPEECH_INPUT_POSSIBLY_COMPLETE_SILENCE_LENGTH_MILLIS'などが正しく（すべての時間）は動作しませんので、頼りにすることはできません。 AudioStream経由以外のビープ音をミュートする方法はありません - Googleが「連続認識サービス」の乱用を防ぐために、これを変更することは非常に低いです。代わりにPocketSphinxを使ってこれを行う方法を見てください。 – brandall

現時点では、Google SpeechRecognizerサービスを使用します。私はそんなにPocketSphinx研究をdidntの、私はit'sので、正確な、そして、この場合には、私はできるだけ早く1つの単語認識を取得する必要がないことを読みました。とにかく、私のアプリが終了するときに試してみましょう。私がより良いサービスを提供できるかどうかを確認する。はそんなに@brandallをありがとうございました！ –

SpeechRecognizerをより高速にすることは可能ですか？

答えて

関連する問題