spark-scalaではなく、spark-SQLにパラメータを渡す方法は？

私はパラメータを指定して、コマンドラインからspark-sqlを実行したいと思います：spark-scalaではなく、spark-SQLにパラメータを渡す方法は？

$ spark-sql myscript.sql hdfs://mydir/myfile.tsv

myscript.sqlでパラメータが

LOAD DATA LOCAL INPATH $PARAM1 INTO TABLE T;

PSを使用する必要があります：私はspark-shellとでそれを行う方法を知っています。しかし、それは私が探しているものではありません。

出典

2017-11-28 Dmitry Petrov

'火花-SQL：

$ spark-sql -d INPUT=hdfs://mydir/myfile.tsv

次に、SQLコードでこのINPUT変数を使用できますか？ – philantrovert

'spark-sql --help'からSQLスクリプトの中でparamsを使う方法はありません（' INPATH $ PARAM1'参照）。 –

-dオプションでパラメータをspark-sqlに渡します。いくつかの-dを使って複数のパラメータを渡すことができます。助けにはならなかった--help`

CREATE TABLE MyTable (
    ID    STRING, 
    VALUE   STRING 
) 
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde' 
WITH SERDEPROPERTIES (
    "separatorChar" = "\,", 
    "quoteChar"  = "\"" 
) 
STORED AS TEXTFILE; 

LOAD DATA LOCAL INPATH '${INPUT}' INTO TABLE MyTable;

出典

2017-12-07 00:25:53

spark-scalaではなく、spark-SQLにパラメータを渡す方法は？

答えて

関連する問題