私は何千もの小さなバイナリファイルにアクセス(読み込み)し、それらを使って計算を行うAzureクラウドサービスを持っています。ここでの重要な要件はスピードです。できるだけ速くする必要があります。私はこれらのファイルを保持するためにAzureブロブストレージを使用しようとしましたが、アクセスは遅すぎました。現在、これらのファイルはAzureクラウドサービスのローカルストレージ自体に保管しています。これは理想的ではありません。なぜなら、永続性は保証されておらず、VMインスタンス全体で共有可能ではないためです。Azureクラウドサービスはどこにファイルを保存する必要がありますか?
私はAzureプレミアムストレージ(VMに接続できるSSDドライブ)について読みました。理論的には理想的ですが、クラウドサービスに追加する方法はありません。
だから、私の質問は以下のとおりです。
- クラウド サービスにAzureのプレミアムストレージSSDのディスクを追加する方法はありますか、それが唯一のAzureのVMに追加することができますか?
- クラウドサービスから何千もの小さなバイナリファイルをすばやく読み取る必要がある場合、他のストレージメカニズムがありますか?
VMではなくCSを使用する必要がありますか? –
クラウドのプログラミングモデルに適合するようにコードを変更します。クラウドをローカルサーバーとして動作させないでください。イベントを処理する場合は、イベントハブまたはストリームアナリティクスを使用する必要があります。ブロブストレージはファイルの*ロット*に比例しますが、多くの小さなファイルを処理しようとすると最適ではありません。実際にデータをロードするよりもネットワークラウンドトリップに多くの費用がかかります。大きなファイルに複数のメッセージをバッチ。 Hadoopのような大規模なデータソリューションでは大きなファイルが大好きですが小さなファイルは大したものではありません。小さなファイルを分割することはできません。 –