テーブルに対してクエリを実行するためにEMR Spark SQLに接続するために必要なDynamoDBテーブルがあります。 Emr-4.6.0とSpark 1.6.1をリリースラベルとするEMR Spark Clusterを入手しました。EMRとDynamoDBを接続するためのemr-ddb-hadoop.jarの取得spark
私は、ドキュメントを参照しています:マスターノードに接続した後Analyse DynamoDB Data with Spark
を、私はコマンドを実行します。
spark-shell --jars /usr/share/aws/emr/ddb/lib/emr-ddb-hadoop.jar
それは警告を与える:
Warning: Local jar /usr/share/aws/emr/ddb/lib/emr-ddb-hadoop.jar does not exist, skipping.
その後、とき
を使用してDynamoDB入力フォーマットをインポートします。
それはエラーを与える:
error: object dynamodb is not a member of package org.apache.hadoop
import org.apache.hadoop.dynamodb.read.DynamoDBInputFormat
error: object dynamodb is not a member of package org.apache.hadoop
import org.apache.hadoop.dynamodb.write.DynamoDBOutputFormat
私はそれがこのエラーの原因となっている瓶だと思います。このemr-ddb-hadoop.jarはどこで入手できますか?
誰かが不思議に思われる場合は、通常、上記の設定ファイルの場所は/etc/spark/conf/spark-defaults.confです。 –