2017-11-28 18 views
0

は、ExcelがtestFile.xlsxファイルあります、それは以下のように次のようになります。AWS GLUEデータインポート問題

ID ENTITY STATE 
1 Montgomery County Muni Utility Dist No.39 TX 
2 State of Washington WA 
3 Waterloo CUSD 5 IL 
4 Staunton CUSD 6 IL 
5 Berea City SD OH 
6 City of Coshocton OH 

は今、私はAWS GLUEで、クローラが作成された、AWSのGLUEデータベースにデータをインポートしたいですクローラを実行した後、AWS GLUEデータベースのテーブルには何もありません。私はそれがAWS GLUEの分類子の問題であるはずですが、AWS GLUEデータベースにExcelファイルのデータを正常にインポートするための適切な分類子を作成することは考えていません。任意の答えやアドバイスありがとう。

答えて

0

「クローラを実行した後にAWS Glueデータベースのテーブルに何もない」と言えば、グルーUIでデータベースをクリックしてからデータベース名をクリックしてから「テーブルをxxx」にします何も表示されていませんか?

質問の2番目の部分は、Glueデータベースにファイルの実際のデータ行をインポートするためのGlueを探していることを示しているようです。あれは正しいですか? Glueデータベースはデータ行を格納せず、ファイルに関するスキーマ情報のみを格納します。実際にデータファイルからmySQLのようなものにデータを移動するには、グルーETLジョブ、Athena、またはハイブを使用する必要があります。

1

私は恐らくGlue CrawlersにはMS Excelファイル(.xlsxまたは.xls)の分類子がありません。 Hereサポートされているフォーマットと組み込みの分類子のリストが見つかります。おそらくAWS Glue Catalogにエクスポートする前に、ファイルをCSVまたはその他のサポートされている形式に変換する方がよいでしょう。

関連する問題