2017-11-02 18 views
0

ストリームアナリティクスを使用してストリーミングデータ(IoTハブ経由)と参照データ(Blobストレージ経由)を結合しています。参照データblobファイルは、最新のデータで1分ごとに生成され、 "filename- {date} {time} .csv"という形式です。参照blobファイルデータは、SAジョブのパラメータとしてAzure Machine Learning関数で使用されます。ストリーム解析ジョブ(Azure SQLまたはPower BI)への出力は、Azure Machine Learning関数の出力ではなく、複数の行を生成しているように見えます。これは、以前のblobファイルのパラメータ値ごとです。私は、最新のBLOBファイルの内容のみを使用してくださいが、すべてのBLOBファイルを使用し、AML出力から複数の行を生成しているように見えます。ここで私が使用していますクエリです:。ストリームアナリティクスのジョブ参照データが重複して作成される

SELECT AMLFunction(Ref.Input1、Ref.Input2)、* IoTInputストリーム 左からJOINをRefBlobInput参考ON Stream.DeviceId =文献[デバイスID]

してくださいレコードの重複を避けるために、クエリやファイルパスを変更する必要がある場合はアドバイスできますか?ありがとう

答えて

0

最新のファイルのみを有効にするには、特定のフォルダ構造でファイルを保存する必要があります。

ストリーム入力として参照データファイルを選択するたびにノートダウンがある場合は、ストリーム入力ダイアログでは、フォルダの構造と日付と時刻の形式が尋ねられます。

ストリームは常に最新の{date}/{time}フォルダから参照ファイルを検索します。 NOTE

(YYYY-MM-DD/HH-MM/filename.json)30/filename.json:ここにあなたの時間、すなわち、あなたは

2018年1月25日/ 07、のようなあなたのファイルを保存する必要がありますフォルダは毎分一意である必要があります。日付フォルダは、日付ごとに一意である必要があります。新しいファイルを作成するたびに、新しいタイムスタンプフォルダーと現在の日付フォルダーの下に作成します。

ストリーム入力がサポートする任意の日時フォーマットを使用できます。

関連する問題