私は、様々なタイプのデータ(例えば、圧力、温度、真/偽)からなるAzure Data Lakeに多くのcsvファイルを持っています。彼らはすべてタイムスタンプが付いているので、機械学習目的のタイムスタンプに従って、それらを1つのファイルに集める必要があります。これは、Javaで行うのは簡単です - ファイルストリームを開始し、各ファイルを開くフォルダをループし、タイムスタンプを比較して関連する値を出力ファイルに書き出し、新しい列を開始します(最初の行の最後に移動します)。各ファイル。 私はU-SQLのタイムスタンプの問題について取り組んできましたが、これをフォルダ全体で実行するのに役立つ構文を考え出すのに問題があります。ワイルドカード構文{*}はすべてのファイルを同じファイルセットとして扱いますが、各ファイルから個別に列を結合するには何らかのループを実行する必要があります。 仮想カラムを使用してこれを行う方法はありますか?ADLAのU-SQLで複数のファイルの列を追加する方法は?
1
A
答えて
1
まず、ループなどの手続き型パラダイムに基づいていない、機能的/宣言的に問題を考える必要があります。
私はあなたの質問を言い換えて、私が助けることができるかどうかを見てみましょう。タイムスタンプの付いたデータを含む多くのcsvファイルがあります。異なるファイルは同じタイムスタンプを持つ行を持ち、同じタイムスタンプ(またはタイムスタンプの範囲)のすべての行を特定のファイルに出力したいでしょうか?だから基本的にデータを再分割したいのですか?
各ファイルの形式は?それらはすべて同じスキーマか異なるスキーマを持っていますか?後者の場合、どのように区別できますか?ファイル名に基づいていますか?
はそれが正しい宣言型の修正再表示し、私の質問への回答であるなら、私はコメントで教えてください、私は次のステップに私の答えを強化します。関連する問題
- 1. U-SQL/ADLA:テーブルで複数のインデックスとパーティションを取得する方法は?
- 2. 複数の文字列をGroovyに追加する方法は?
- 3. Apache Sparkで複数の列を追加する方法
- 4. WPFの複数列のデータバインドリストビューにデータを追加する方法
- 5. RasterStackに複数の.ncファイルを追加する方法R
- 6. xmlファイルに複数のユーザーを追加する方法
- 7. 複数のxslファイルを1つに追加する方法
- 8. 複数のファイルをアップロードする方法、フィールドを追加してデータベースへのフルパスを追加する方法
- 9. 複数のPDF名ファイルに同じ文字列を追加する方法
- 10. 複数の値を同じ配列に追加する方法
- 11. 複数のオブジェクトを配列に追加する方法
- 12. Rails 5.0でActiveAdminの列に複数のアクションを追加する方法は?
- 13. FATCAのXML - FATCAのXMLファイルで複数のデータを追加する方法
- 14. 複数のファイルを追加するPHP
- 15. アンドロイドで複数のマーカーをマップビューに追加する方法は?
- 16. SQLiteDatabase挿入メソッドで複数の列を追加する方法は?
- 17. PowerQuery:複数の列を追加する
- 18. 複数の行の値をSQLに追加する方法は?
- 19. 複数の値のセットをキーに追加する方法は?
- 20. Rで複数のExcelファイルの列をマージする方法は?
- 21. 配列をUSQLストアドプロシージャに渡す方法
- 22. 次のJavaScriptで複数のテキストメッセージを追加する方法
- 23. 複数のデータフレームに複数の列を追加する
- 24. awk:複数のcsvファイルの列を1つのcsvファイルに追加する
- 25. 複数の値をスキャンして配列に追加する方法は?
- 26. pysparkの1行から複数の行と複数の列を追加する方法は?
- 27. カスタム関数から複数の列をデータフレームに追加する方法R
- 28. zip.jsで複数のファイルをzipに追加するには?
- 29. USQLで異なる列のファイルを処理する
- 30. 複数のイメージをワードプレスでカスタムポストに追加する方法
ありがとうございます! 確かに、私は間違いなく問題を見ている問題です。 各ファイルの形式は、2つまたは3つの列から構成されています。タイムスタンプ - バリュー・ユニット。ユニット列が存在する場合もあれば、存在しない場合もあります(例:True/Falseフィールドの場合)。各ファイルは同じユニット/フィールドではありません。例えば、一つのファイルには、温度や他の空気圧や偽/別の真である可能性があります。私は、各フィールドが個別の列で、最も近いタイムスタンプによって調整されるように、これらの別々のファイルを結合していますよ。タイムスタンプは、各ファイルについてまったく同じではありません。私は意味がありますか? –