EMRでクラスタを作成していて、S3からノートブックを読み取るようにZeppelinを設定しています。クラスタ起動時にEMRでZeppelinのSpark Interpreterを設定する
[
{
"Classification": "zeppelin-env",
"Properties": {
},
"Configurations": [
{
"Classification": "export",
"Properties": {
"ZEPPELIN_NOTEBOOK_STORAGE":"org.apache.zeppelin.notebook.repo.S3NotebookRepo",
"ZEPPELIN_NOTEBOOK_S3_BUCKET":"hs-zeppelin-notebooks",
"ZEPPELIN_NOTEBOOK_USER":"user"
},
"Configurations": [
]
}
]
}
]
私はEMRのStoftware設定ページにこのオブジェクトを貼り付けています:私はそのように見えるJSONオブジェクトを使用していますことを行うには、 私の質問は、である私には、Sparkインタプリタを構成することができますどこか/クラスタを起動するたびにZeppelinから手動で設定する必要はありませんか?
で開始してください。@rdeboo。 "2ANGGHHMQ"についてもっと詳しく教えてください。そして、 "spark.yarn.executor.memoryOverhead"を2048に設定する例を挙げてください。spark.executor.memoryとspark.executor.coresと共に私の場合です – Rami
@Ramiそれは関連するセクションを識別する内部キーの名前ですインタープリタ.jsonで。それは安定しているようです(私は、さまざまなバージョンのEMRでインスタンス化された多くのものを見てきました)。しかし、これが変わらないという保証はありません。いずれにしても、AWSはデフォルト設定を修正して、この回避策の使用をやめることができます。 – rdeboo
これは素晴らしい作品です!しかし、私の場合は批判的な調整が必要でした。残りのAPIを使用してインタプリタを再起動しても、interpreter.jsonの変更は反映されません。ツェッペリン自体を再起動する必要がありますが、少なくともこれはEMRで発生します。したがって、curlではなくsudo /usr/lib/zeppelin/bin/zeppelin-daemon.shを再起動してください。 –