MBサイズの範囲内にある1,000,000個のファイルの高い並行アクセス(例えば、ローカル1 gbsネットワーク上の10000個のリモートスレッド)には何がありますか?DSFユーザーに高い同時ストリームを提供する必要がありますか?小ファイルの同時並行アクセスのための分散ファイルシステム
1
A
答えて
0
LustreやGPFSなどの一般的なHPCファイルシステムでは、説明するシナリオを適切にサポートしない場合がありますが、大きなファイルアクセスでは高帯域幅に最適化されることがよくあります。 HPC環境では、MPI-IOなどのIOミドルウェアやHDF5などの高レベルIOライブラリをファイルシステムと直接接続するのではなく、使用することを検討する必要があります。これらのライブラリは、アプリケーションの特定のファイルシステムへのアクセスを最適化する複雑さを隠すことができます。これは、アプリケーションシナリオの構造によって異なります。
一方、並行性が高く、構造化されていない小規模なアクセスの場合、クラウド関連の技術を調べることをお勧めします。 Googleのファイルシステム、分散キー値ストレージ、Cassandraなど、さらなる研究のためのいくつかの指針を提供しています。
一般的な「ファイル」抽象アクセスアプローチ(POSIXインターフェイス)は、並行アクセスのために設計されたものではないため、インターフェイスとの適合性と同時に高い並行性を実現することが困難です。
適切なテクノロジの具体的なヒントが必要な場合は、ユースケースに関するより具体的な情報を提供してください。
関連する問題
- 1. 小規模ファイル用高速分散ファイルシステム
- 2. 分散ファイルシステム上でのファイルの移動
- 3. .NET用の分散ファイルシステム
- 4. Hadoopの分散ファイルシステム上のPythonのファイル(の.py)(HDFS)
- 5. 一定時間クローニングをサポートする任意の分散ファイルシステム
- 6. hadoop分散キャッシュ内のファイルへのアクセス
- 7. 仮想ファイルシステムは分散ファイルシステムの上にありますか?
- 8. 分散同期実行
- 9. 同時に実行してはいけないタスクをシリアル化するためにセマフォシステムを分散させるための分散セマンティックシステム
- 10. 分散/並列コンピューティング
- 11. Proc GLMの分散共分散行列
- 12. 同期データを格納するための分散アルゴリズム
- 13. Webアプリケーションの平均並行同時ユーザー数と同時並行ユーザー数
- 14. 分散並列バッチ処理
- 15. 分散テストのためのロボットフレームワーク
- 16. マルチレベルモデリングのための共分散構造
- 17. 分散アルゴリズムプログラミングのためのヘルパーライブラリ?
- 18. Pythonで分散と並列コンピュータのユニセックスバスルームソリューション
- 19. グリッド上の分散行列を扱うためのC++ライブラリ
- 20. ウェブサイトの作り方、分散ファイルシステムを使用したデータ管理のためのhadoop
- 21. Amazon EC2のエンタープライズアプリケーション用の分散ファイルシステム/ DBは何ですか?
- 22. 並行タスクを実行するためのリストの分割
- 23. 最小オーバーヘッド分散イベントロギングライブラリ/フレームワーク?
- 24. 問題キューの同時&非並行NSOperations
- 25. Julia並列計算の同時実行
- 26. 小規模のJava分散プログラミング
- 27. Webマシン間でデータを共有するための小規模分散データベース
- 28. 時間とキーで区切られたPearson相互相関行列の計算のための分散アルゴリズム
- 29. AngularJSアプリで同時並行腕時計
- 30. 分散MVCパターンを実装するための分散キャッシュソリューションを見る