我々はそうのようなディレクトリ構造を持っている場合:ロード関係
/hdfs/foo
/hdfs/foo/foo1
/hdfs/foo/foo2
オークのファイルは、foo1のとfoo2はしています。おそらくfooの下にいくつでもサブディレクトリが存在する可能性があります。 (パーティション化されたファイルです)。
サブディレクトリのすべてのファイルをリレーションに読み込むにはどうすればよいですか?
私が試してみた:
relation = LOAD '/hdfs/foo' USING OrcStorage();
をこれは私にエラーを与えるものではありませんが、関係はそれが必要データのほとんどを持っていません。私は実際にこれが実際に何をしているのか分かりません。
relation = LOAD '/hdfs/foo*' using OrcStorage();
これで、ファイルが見つかりませんでした。
relation = LOAD '/hdfs/foo/*' using OrcStorage();
これにより、ファイルが見つかりませんでした。
私は間違っていますか?