-1
テキスト形式(wordとpdf)のプロジェクトレポートがたくさんあります。これらのファイルには、抽出したいデータが含まれています。参照、キーワード、名前など.......スキーマとしてコンテキストテーブルを使用してテキストファイルをハイブに保存する方法
これらのファイルをApache sparkで処理し、その結果をハイブに保存するには、 を使用します(スキーマとしてコンテキストテーブルを使用します)それは可能ですか?
これらのファイルの処理方法について私にお伝えしたいと思いますか?
「スキーマとしてのコンテキストテーブル」の意味を明確にしてください。 –
文書の字幕(はじめ、要約、参考文献など) –