Eventhubutilsライブラリによって生成されたプロセスディレクトリは、hdfsに多数の小さなファイルを作成しています。 https://github.com/Azure/spark-eventhubs/blob/master/docs/direct_stream.md。これらの小さなファイルのために、namenodeに多くの負荷があります。スパークアプリケーションを妨害せずに進行ディレクトリを削除する方法はありますか?私の経験パーeventhubからアプリケーション受信メッセージを受信するspark-streamingによって生成された進行ディレクトリを削除する方法
0
A
答えて
0
あなたの現在のタスクが実行されている場合、結果のファイルを削除することはできません。
ここでは、参考のためにコードなしでファイルを削除する2つの方法を提供します。
最初の方法:
HDFS
上のファイルがazure blob storage container
で見つけることができるので、あなたは、Azureのポータル上で直接それらを削除することができます。 1つずつファイルを削除したくない場合は、Azure Storage Explorerツールを使用して、削除するすべてのファイルを選択することができます。
第二の方法:
クラスタ・マシンにログオンし、あなたがconfiguration fileに対応するazure blob storage container
パスを見つけることができますrm command line:
hadoop fs -rm [-f] [-r |-R] [-skipTrash] URI [URI ...]
を使用することができます。
wasbs://[email protected]/testDir/testFile.
希望します。
関連する問題
- 1. 受信トレイからメッセージを削除
- 2. Azure Eventhub受信データをSQLデータベースに送信する方法
- 3. 別のアプリケーションでTraceAppenderから送信されたlog4netメッセージを受信する
- 4. サービスから送信されたインテントを受信する方法
- 5. 受信メッセージの場所/受信メッセージを傍受する
- 6. 受信トレイから受信したSMSをブロードキャストまたは削除します。
- 7. WCFクライアントから送受信されたメッセージを正確にログする方法
- 8. BotKitで音声メッセージを受信または受信する方法
- 9. トピックからメッセージを受信するMQTT
- 10. GCMからメッセージを受信
- 11. ejabberdクライアントからnode-xmppにメッセージを受信する方法
- 12. 他のアプリケーションがインストールまたは削除されたときにアプリケーションがブロードキャストを受信する方法
- 13. コンテンツスクリプトからpopup.js/htmlに送信されたメッセージを受け取る方法は?
- 14. JMSテンプレートを使用してMQ経由で受信したメッセージからJMSリーダーを削除する方法
- 15. iPhoneで送信メッセージと受信メッセージを保存するアプリケーションを作成する方法
- 16. UDPメッセージを受信する
- 17. サーバーから受信したSOAPメッセージから名前空間を削除する方法
- 18. メッセージをアンドロイドウェアに送信するアンドロイドデバイスにメッセージを送信しますが、着信時に受信したメッセージは受信されません。
- 19. MailKit:Gmailの設定時に受信トレイからメッセージが削除されない
- 20. 受信メッセージからMSMessageサマリーテキストを取得する方法?
- 21. メッセージの受信1クライアントが受信した後、クライアントとメッセージ削除のために複数回
- 22. awsのwhileループでメッセージを受信して削除します
- 23. Twilioで受信したすべてのメッセージを削除するにはどうすればよいですか?
- 24. Androidで受信したメールを受信する方法
- 25. 受信メッセージから放送を受信できません
- 26. パケットがアプリケーションによって受信されたかどうかを確認する方法
- 27. 外部から投稿された着信Jsonデータを受信する方法
- 28. どのようにeventhubから別のeventhubにメッセージを送信しますか?
- 29. codeigniterの受信メールからmimepartを削除するには?
- 30. Node.js Webアプリケーションでメッセージと受信ボックスのオプションを送信する方法
イベントハブの保存期間より古いファイルを削除することを意味しますか?継続的に動作するスパークストリーミングジョブに何らかの問題を引き起こすことはありませんか? –
@sivakrishna提供したコードから(https://github.com/Azure/spark-eventhubs/blob/228e1b4ef8c73ddb7e9e44c4216a86f1f3912e9e/core/src/test/scala/org/apache/spark/sql/streaming/eventhubs/EventHubsStreamTest.scala #L423)、生成ファイルにタイムスタンプが付いていることがわかりました。タイムスタンプに基づいて使用しないファイルをクリーンアップすることができます。 –