amazon-athena

    0

    1答えて

    私はawsで、ログファイルの束を解析するためにathenaを使用しています。照会の基準は、base64でエンコードされたサブストリングです。 ( "adId = eW0vMU0zeGE5NUE4NjcyLzYzNDgvalhkVGhkZmxfODQwS182NDB4MzYwLm1wNAo =%somejunk") 私の知る限り、このクエリに問題はありません。 SELECT count(*) FR

    1

    1答えて

    Glue/Athenaに登録されているデータセットをmy_db.tableと呼びます。私はAthena経由でそれを照会することができ、すべてが一般的に順番になっているようです。 私はのりジョブでこのテーブルを使用しようとしているが、次のかなり不透明なエラーメッセージ取得しています:これは、接着剤は私のカタログ項目を見ることができないことを示しているように思われる py4j.protocol.Py4

    1

    1答えて

    こんにちは CREATE EXTERNAL TABLE IF NOT EXISTS axlargetable.mine ( createdate string ) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES ( 'separatorChar' = ',',

    1

    1答えて

    における根本的なS3バケットのアドレス決定:私は場所のために、私はこれを取得、テーブルのプロパティをクリックしたとき SELECT * FROM analysisdata."iris" limit 10; を: s3://Bladata887342ac-a3ce-4600-94d0-9092f4a6bd20/Iris は何IこれですそのようにPythonコードでs3_staging_dir

    0

    1答えて

    こんにちは私はcsvファイル形式S3を読む次のクエリでアテナでテーブルを作成しました。私は値からすべてのエスケープ文字(バックスラッシュ)を欠落している "\emdc1fasHR_UKADPFreedom_Employee_20141114_11.04.00.csv" ように私の値が表示されます。このテーブルを読み込むときに、ファイル名に CREATE EXTERNAL TABLE IF NO

    0

    1答えて

    AWS Athenaでクエリを実行し、その結果をs3に書き込みます。私はラムダスクリプトからクエリを実行すると、ファイルが利用可能になるのに長い時間がかかるようです(実際は長すぎます)。 私は70MBのデータをスキャンしており、返されるファイルは12MBです。私はアテナに直接クエリを実行する場合は、実行するために2.97秒かかり athena_client = boto3.client('athe

    0

    1答えて

    私は(括弧内にサンプルデータ)は、次のcsv形式でS3におけるいくつかのログファイルを持って作成する際のdatetime列を分割する方法: userid (15678), datetime (2017-09-14T00:21:10), tag1 (some random text), tag2 (some random text) を私はアテナ・テーブルにロードし、データを分割したいです

    1

    1答えて

    Amazon S3でAthenaテーブルのソースとして* .tsvファイルを定義し、OpenSSVSerdeまたはLazySimpleSerDeをデシリアライザとして使用すると、正しく動作します。しかし、* .tsvファイルを含む* .tar.gzファイルを定義すると、テーブルにいくつかの奇妙な行が表示されます(たとえば、tsvファイル名といくつかの空の行を含む行)。 Athenaでtar.gzフ

    0

    1答えて

    私は会議への人の出席のため、以下のJSONオブジェクトがあります。私はS3 に格納されたデータを持っているところを指してテーブルを作成するために、次のコードを実行した {"conferences_attended": [ {"conference_name": "dreamforce", "date": "2017", "city": "san franc