テキストファイルからハイブテーブルを作成するためにRegex SerDeを使用しようとしています。私は簡単に始めて、テキスト・ドキュメントの各単語を1行に解析したいだけです。各行には1つの列があり、それが単語です。Regex SerDeでHive各単語が列になるように行を分割します。
私が使用している正規表現がある([a-zA-Z]の+)
そして、これは私がハイブに発行していますCREATE TABLEコマンドの後半で、
行形式のSERDE「組織( "input.regex" = "([a-zA-Z] +)"、 "output.format.string" = "%1 $ s")を使用して、.apache.hadoop.hive.contrib.serde2.RegexSerDe ' STEXED AS TEXTFILE;
現在、テーブルにはほとんどすべてNULLが含まれています。
何か助けが素晴らしい、ありがとう!
テーブルにはほとんどすべてのNULLが含まれていると述べました。どうしたらいいですか? NULL以外の列がいくつかありますか?あなたはあなたのデータの小さなサンプルを提供していただけますか? –