2017-04-11 14 views
2

紺碧のブロブストレージアカウント(1つの電子メール=ブロブストレージ内の1つのドキュメント)に約500k個の電子メールが格納されています。今、私は、これらの電子メールのすべてのコンテンツを青空の認知テキストのAPI(https://www.microsoft.com/cognitive-services/en-us/text-analytics-api)で分析したいと思います。それはかなりうまくいっていますが、何千もの電子メールを一括して処理する必要があるので、これを行うにはどうすればいいでしょうか?これで私を助けることができる別の晴れた分析製品がありますか?または、私はちょうどドキュメントを取って、そのことをやっている蒼穹の関数を作成するのですか?認知テキスト分析を使用した電子メールの一括処理

+0

私はあなたの懸念がratelimitingだと思いますか? –

+0

こんにちはマリア、あなたの答えに感謝します。実際にはありません。私はレート制限をしたくないですが、何千もの電子メールを処理するための大規模な並列実行への道を探しています...私は1つのアプリケーションでマルチスレッドを使用する以外は何のソリューションがあるのだろうか... – LaurinSt

答えて

0

Text Analytics APIを使用すると、一度に最大1000のレコードを送信できます。毎分100リクエストを提出できます。

小さなバッチを送信する方法の例が表示されますhere。 3の代わりに1000のレコードを送信するように変更するのは難しくありません。

毎分100回未満のリクエストを効果的に送信できるように、各バッチコールの間に何らかの遅延を追加することをお勧めします。

バッチリクエストの最大ペイロードは1MBを超えることはできませんので、分析する電子メールのサイズに応じて、バッチを1000個未満のドキュメントにすることをお勧めします。

Luis Cabrera |テキスト分析PM |マイクロソフト

関連する問題