0
に
を移行するとき、私は次のようにインパラでの組み込み関数を使用しています。今、私は(Jupyterノートでpysparkを使用して)SparkSQLに移行していますインパラ組み込み関数は利用できませんインパラからSparkSQL
select id, parse_url(my_table.url, "QUERY", "extensionId") from my_table
:
また、以下試してみましたNameError: name 'parse_url' is not defined
:
my_table.select(my_table.id.cast('string'), parse_url(my_table.url.cast('string'), "QUERY", "extensionId")).show()
しかし、私は次のエラーを得た
my_table.registerTempTable("my_table")
sqlContext.sql("select id, url, parse_url(url, 'QUERY', 'extensionId') as new_url from my_table").show(100)
しかし、すべてnew_url
はnull
になります。
私がここで逃したものは何ですか?また、どのように人々はそのような問題を扱うだろうか?ありがとう!