テーブルに含まれる異なるキー値の数がわからない場合は、列の値に基づいて複数のファイルに自動的に分割できますか? キー値をファイル名に入れることはできますか?Azure Data LakeでのU-SQL出力
答えて
大きな質問!私は、リース氏が何を返答しているか見ることに興味があります。
謝罪しますが、これは半分の答えです。
私の最初の考えは、あなたのキー値を使ってADLテーブルを分割することです。しかし、潜在的なWHERE句が確定的でない場合は、別々の出力をどのように扱うかはわかりません。たぶん、すべての結果でクロスに参加して....通過してください!
動的なコードを含むWHILEループを使用するとよいでしょう。
ダイナミック入力データセットについて語っているMSフォーラムでこの記事をチェックしてください。 FYIと同じように。
これが私たちのtop askである(そして、あまりにも:)以前asked on stackoverflowてきました。私たちは現在、それに取り組んでおり、夏までに利用できるようにしたいと考えています。
それまでは、スクリプトジェネレータを作成する必要がありました。ここで
など私は、スクリプトを生成するために、U-SQLを使用する傾向がありますが、PowerShellのか、T4でそれを行うことができ例です。は、あなたが次の表に列name
用のファイルを作成したいと仮定しましょう/行セット@x
:
name | value1 | value2
-----+--------+-------
A | 10 | 20
A | 11 | 21
B | 10 | 30
B | 100 | 200
あなたは次のようなスクリプトを生成するスクリプトを記述します。
@x = SELECT * FROM (VALUES("A", 10, 20), ("A", 11, 21), ("B", 10, 30), ("B", 100, 200)) AS T(name, value1, value2);
// Generate the script to do partitioned output based on name column:
@stmts =
SELECT "OUTPUT (SELECT value1, value2 FROM @x WHERE name == \""+name+"\") TO \"/output/"+name+".csv\" USING Outputters.Csv();" AS output
FROM (SELECT DISTINCT name FROM @x) AS x;
OUTPUT @stmts TO "/output/genscript.usql"
USING Outputters.Text(delimiter:' ', quoting:false);
次に、あなたのta ke genscript.usql
の場合は、計算を@x
の前に置き、送信して2つのファイルに分割されたデータを取得します。
"/ output/genscript.usql"ファイルのスクリプトを入力してください。 – Arron
こんにちはArron、私はあなたが私に提供したいと思うか分からない。上記のスクリプトは、genscript.usqlコンテンツを生成します。 –
@xデータセットは外部のgenscript.usqlファイルにどのように渡されますか?それを実行する最良の方法は何ですか?データファクトリー? – coltonfranco
- 1. Azure data lake usqlの自動gurnatedカラム
- 2. Powershell - Azure Data Lake Store
- 3. Data Lakeでは、Azure Storageにデータを出力できますか?
- 4. Azure Data Lake AnalyticsのE_RUNTIME_SYSTEM_ERROR
- 5. Azure Data Lake Analytics Add Powershell API
- 6. Azure Data Lake Analytics IOutputter E_RUNTIME_USER_ROWTOOBIG
- 7. Azure関数Azure Data Lake用カスタムDLL
- 8. Azure Data Lake Analyticsのメモリ制限
- 9. Azure Data Lake Storeの一貫性
- 10. Azure Data Lake Countすべてのアイテム
- 11. SSISのData Lake Storeソースの出力タイプを変更
- 12. Azure Data上のパブリックデータセットData Lake Analyticsで使用するストア
- 13. Azure Data Lake Store SDK:FileStatusProperties.ChildrenNumプロパティ常にnull
- 14. Azure Data Lakeを照会するには?
- 15. Azureテーブルストレージ - Data Lake File - USQLを使用して単一行のSelect文をフェッチする際のSLOW応答時間
- 16. Azure MLの入力データセットとしてAzure Data Lake Storeを使用するには?
- 17. StreamアナリティクスでData Lake Storeの可能な出力パスプレフィックス
- 18. Azure Data Lake StoreとWebJob/Azure機能付きAzure SQL
- 19. Azure Key VaultにAzure Data Lake Analyticsからアクセスできない
- 20. Azure BLOBのデータをAzure Data Lakeにコピーするベスト(クイック)方法
- 21. Hadoop Vs Data Lake
- 22. AzureサービスバスキューからAzure Data Lakeへメッセージをトリガーする方法は?
- 23. Azure Data Lakeでの圧縮コーデックの影響
- 24. SSISコンポーネント - Azure Data Lake Storeフラットファイルをロードできないソース
- 25. Azure Data LakeからSQL Serverにデータを抽出する最良の方法
- 26. Azure Dataからのファイルの作成Lake Store .NET SDK
- 27. IoTハブからAzure Data Lakeへのメッセージのルーティング
- 28. Azure Data Lake Store Java SDKを使用したプロキシ経由のアクセス
- 29. Azure Webjobs SDK - Azure Data Lake Storeファイルにバインディング/トリガーを作成できますか?
- 30. エラーが発生したAzure Data Lake U-SQLジョブ:JM_FinalMetadataOperationUserError
正確に!カーソルやwhile/forループでは簡単な作業ですが、反復がないと、多くのシナリオでは使用できません..... – peterko
私は使用できないと言っていません。 USQLは宣言型言語で、作業負荷を柔軟にスケーラブルに並列化できます。データの反復処理が遅く、おそらく間違ったツールを使用する必要がある場合は....これはOracleのカーソルではありません! :-) –
あなたは正しく、私のケースでは使用できないと言っています:) – peterko