私は、parquet-tools.jar(https://github.com/Parquet/parquet-mr/tree/master/parquet-tools)を使用して寄木張りファイルから1つの列を印刷しようとしています。 私は、このコマンドを使用しています:parquet-tools jarを実行している引数が無効
java -jar parquet-tools-1.6.1-SNAPSHOT.jar dump -c COLUMNNAME someParquet.parquet
をしかし、私は得る:
Invalid arguments: missing required arguments
usage: parquet-dump [option...] <input>
where option is one of:
-c,--column <arg> Dump only the given column, can be specified more than
once
-d,--disable-data Do not dump column data
--debug Enable debug output
-h,--help Show this help string
-m,--disable-meta Do not dump row group and page metadata
--no-color Disable color output even if supported
where <input> is the parquet file to print to stdout
私は構文が間違って取得していますどこわかりません。
おそらく、これらのスクリプトhttps://github.com/wesleypeck/parquet-tools/tree/master/src/main/scriptsを使用したいと思うかもしれません。ヘルプページで提案されているような構文になっているはずです –
構文を正しく取得します。これは、Apache CLIライブラリのバグ、またはparquet-toolsの使い方のバグのようです。 – Zoltan
私は同意し、apache cliの使用に問題があるようです。 '--column NAME'、' --column = NAME'などを試してみてください。 – borowis