Spark on Scalaでワードカウントラボを実行しようとしています。私は正常にテキストファイルを変数(RDD)に読み込むことができますが、.flatmap、.map、およびreduceByKeyを実行すると、添付のエラーメッセージが表示されます。私はこれに新しいので、どんなタイプの助けも大いに感謝されるでしょう。私にお知らせください。 captureScalaのスパークワード数(Apache Sandboxで実行中)
-3
A
答えて
1
あなたがの完全修飾パスを与える必要があり、次の形式
sc.textFile("hdfs://namenodedetails:8020/input.txt")
0
でファイルを指定する必要がHadoopの
上のファイルの存在を検出することができませんでしたので、あなたのプログラムが失敗していますファイル。 Sparkは依存関係グラフを作成し、アクションが呼び出されたときに遅延評価をするので、アクションを呼び出すときにエラーに直面しています。
1次回または.take(N)メソッド
関連する問題
- 1. Hortonworks Sandboxでphpを実行中
- 2. ApacheでAngularDartを実行中
- 3. Javaを使ったスパークワード数
- 4. FileNotFound Apache Tomcatで実行中の例外?
- 5. Apacheで実行中のssl、Xampp
- 6. ubuntuで実行中のapache /アプリケーション
- 7. Apacheで画像アップロードコードを実行中
- 8. apache flumeのエージェントを実行中
- 9. OutOfMemory Spark Scalaシェルで実行中の例外
- 10. Amazon EC2で実行中のApacheを接続できません
- 11. ScalaとSparkでの複数の関数の並列実行
- 12. Scalaでデバッグ中に対話的にコードを実行
- 13. Apacheで実行中にPythonのインポートエラーが発生しました
- 14. Apache/ResinでのVirtualhosts設定(Adobe ColdFusion 8を実行中)
- 15. HerokuのPlay/scalaアプリの実行が中止されました
- 16. 実行中のプロセス数
- 17. 複数のスパイダーでセレンヘッドレスを実行中
- 18. Scalaコンパイラを使わないでApache Sparkを実行してダウンロードする
- 19. Paypal sandbox保留中のお支払い
- 20. Scala - コンストラクタ引数の実行時の型でコンストラクタを選択
- 21. Oracle Virtual BoxでHortonworks Sandboxを実行しています
- 22. APACHEでWebmatrix ASP.netを実行
- 23. Apache ZeppelinでSparkを実行
- 24. Apache Spark:Kafkaプロデューサの実行中にInstanceAlreadyExistsExceptionを取得する
- 25. 他のscalaプログラムでscalaプログラムをコンパイル&実行するには?
- 26. Apache SparkとScalaの並列実行時間と順次実行時間を測定するには
- 27. クラス関数内でスレッドを実行中
- 28. Scala IDEでScala IDEでコンパイルエラーを実行する
- 29. intellijでSpark-Scalaの例を実行中にエラーが発生しました
- 30. Androidで実行中のタスクと実行中のプロセスの違い
を使用してHDFSからファイルを読んだ後、あなたが正常にファイルをロードすることができませんデバッグすることをお勧めします。 'sc.textFile(...)'行(この 'sc.textFile(myNonExistingFile.txt)'のようなものを試してください)では、データは初期化しますが、変換はしません。 'flatMap'を呼び出すと、ファイルが存在しないため、実行が開始され、エラーが発生します。 https://spark.apache.org/docs/latest/programming-guide.htmlを参照してください –