物理的な場所から火花ストリームを作成するための任意の信頼できる方法がある場合、私は不思議でしたか?私は 'textFileStream'を使用していましたが、ファイルがHDFSにある場合は主に使用されているようです。あなたは、関数の定義を参照した場合には、Apacheのスパーク
0
A
答えて
2
を「Hadoopの互換ファイルシステムを監視し、入力ストリームを作成します」と言うあなたはHDFSは、物理的な場所ではないことを示唆していますか?物理的に存在するdatanodeディレクトリがあります...
file://
URIでtextFileを使用できるはずですが、クラスタ内のすべてのノードがその場所から読み取れるようにする必要があります。 Hadoopの互換性のあるファイルシステムの定義から
。
使用するファイルシステムの選択は、それを参照するために使用されるURIスキームに由来します。任意のファイルパス上の接頭辞hdfs:は、HDFSファイルシステムを参照することを意味します。ファイル:ローカルのファイルシステムに、S3:アマゾンS3には、ftp:FTP、SWIFT:OpenStackSwift、...など。
Hadoopの
申し訳
関連する問題
- 1. Apacheのスパーク -
- 2. Apacheのスパーク:mapPartitionsWithIndex
- 3. Apacheのスパーク、SBT /アセンブリ
- 4. Apacheのスパーク:java.lang.NoSuchMethodErrorの.rddToPairRDDFunctions
- 5. 印刷CoordinateMatrix Apacheのスパーク
- 6. Apacheのスパーク:ERRORエグゼキュータ - >イテレータ
- 7. Apacheのスパーク:参加RDDS(データセット)
- 8. Apacheのスパークが一時ディレクトリ
- 9. 'どこでapacheのスパークで
- 10. ApacheのスパークはAGG DATAFRAME GROUPBY()
- 11. Apacheのスパークは、クラスCSVReader
- 12. apacheスパーク理解密度ベクトル
- 13. ScalaのApacheのスパーク:列名に括弧
- 14. ApacheのスパークDATAFRAME:df.where()は、Javaで:List属性
- 15. ApacheのスパークにおけるSortbykey
- 16. Apacheのスパークは、(updateStateByKey後にマージ)
- 17. Apacheのツェッペリンとスパーク配備モードオプション
- 18. Apacheのスパークで結果をプロットする
- 19. スパークSqlContextとHbase:java.lang.NoClassDefFoundError:org/apache/hadoop/hbase/util/Bytes
- 20. 2の値は、JavaでApacheのスパークを使用して
- 21. カサンドラコネクタApacheのスパーク:ローカルクラス互換性のない
- 22. Apacheのスパーク - java.lang.NoSuchMethodErrorの:breeze.linalg.Vector $ .scalarOf()Lbreeze/linalg /サポート/ ScalarOf
- 23. Apacheのスパーク - ハイブ内部結合、LIMITおよびカスタムUDF
- 24. ApacheのスパークmapPartition奇妙な行動(遅延評価?)
- 25. ロードCSVデータは、データフレームへとApacheスパーク(Java)の
- 26. スパークApacheが "NULL"の値を削除していない
- 27. 移入Elasticsearchは、私のようなスキームでスパークでのデータフレームを持っているApacheのスパーク
- 28. スパークでハイブクエリを実行する - java.lang.NoClassDefFoundError org/apache/hive/spark/client/Job
- 29. スパーク2.0.2 twitterストリーミングがapache bahirに見つかりません
- 30. が、私はApacheは2.0スパーク使用していますキー列
に新しいスキーマを追加するために必要な関連するJava JARファイル、ネイティブバイナリおよび設定パラメータを通じてのHadoopとの明示的な統合を提供する他のファイルシステムは、私はUNIX/Windowsファイルシステムによって物理的な場所を意味があります私はローカルコアを持つWindowsでそれを複製しようとしていましたが、ファイルを変更してスパークジョブが実行されているときにファイルを移動するときにしか読めるような問題があるようです。 –
はい、ストリーミングドキュメントは、「ファイルが原子移動やデータディレクトリにそれらの名前を変更することにより、DATADIRECTORYで作成されなければならない」と言うスパーク。つまり、既存のファイルは読み込まれません。ファイルへの追加は –
@Satyabratを動作しませんこれは、あなたの質問に答えていますか? –