2017-08-23 10 views
0

私は最近、セットアップ、再教育の更新と例ドキュメント紺碧の機械学習、Webサービスのトレーニング出力

と私のパイプラインが

{ 
    "name": "RetrainAndExecutePipeline", 
    "properties": { 
    "activities": [{ 
     "type": "AzureMLBatchExecution", 
     "typeProperties": { 
     "webServiceOutputs": { 
      "Output-TrainedModel": "TrainedModel" 
     }, 
     "webServiceInputs": {}, 
     "globalParameters": {} 
     }, 
     "outputs": [{ 
      "name": "TrainedModel" 
     } 
     ], 
     "policy": { 
     "timeout": "01:00:00", 
     "concurrency": 1, 
     "executionPriorityOrder": "NewestFirst", 
     "retry": 3 
     }, 
     "scheduler": { 
     "frequency": "Day", 
     "interval": 1, 
     "offset": "22:00:00", 
     "style": "StartOfInterval" 
     }, 
     "name": "Retrain ML Model", 
     "linkedServiceName": "TrainingService" 
    }], 
    "start": "2017-08-20T22:00:00Z", 
    "end": "9999-09-09T00:00:00Z", 
    "isPaused": false, 
    "hubName": "autdatafactoryml_hub", 
    "pipelineMode": "Scheduled" 
    } 
} 
以下と同様の設定であります私はトレーニングが完了した後、私は「トレイン・モデル」ノードに接続されたWebサービスの出力からAzureブロブストレージに入る出力であることに気づいた0

{ 
    "name": "TrainedModel", 
    "properties": { 
     "published": false, 
     "type": "AzureBlob", 
     "linkedServiceName": "AzureStorageLinkedService", 
     "typeProperties": { 
      "fileName": "trainedModel.ilearner", 
      "folderPath": "trainingoutput", 
      "format": { 
       "type": "TextFormat" 
      } 
     }, 
     "availability": { 
      "frequency": "Day", 
      "interval": 1, 
      "offset": "22:00:00", 
      "style": "StartOfInterval" 
     } 
    } 
} 

以下TrainedModelデータセットilearnerファイルと、指定していないにもかかわらず拡張子のない2つのランダムに名前の付いたファイルがあります。あなたはこのJSONファイルがある

{ 
    "visualizationType": "learner", 
    "learner": { 
    "name": "LogisticRegressionClassifier", 
    "isTrained": true, 
    "settings": { 
     "records": [ 
     ... 
     ], 
     "features": [ 
     { 
      "name": "Setting", 
      "index": 0, 
      "elementType": "System.String", 
      "featureType": "String Feature" 
     }, 
     { 
      "name": "Value", 
      "index": 1, 
      "elementType": "System.String", 
      "featureType": "String Feature" 
     } 
     ], 
     "name": null, 
     "numberOfRows": 8, 
     "numberOfColumns": 2 
    }, 
    "weights": { 
     "records": [ 
     ... 
     ], 
     "features": [ 
     { 
      "name": "Feature", 
      "index": 0, 
      "elementType": "System.String", 
      "featureType": "String Feature" 
     }, 
     { 
      "name": "Weight", 
      "index": 1, 
      "elementType": "System.Double", 
      "featureType": "Numeric Feature" 
     } 
     ], 
     "name": null, 
     "numberOfRows": 92, 
     "numberOfColumns": 2 
    } 
    } 
} 

以下のようにJSONとしてフォーマット紺碧ML実験内の出力を視覚化するときあなたが見ることができる内容

<?xml version="1.0" encoding="utf-8"?> 
<RuntimeInfo> 
    <Language>DotNet</Language> 
    <Version>4.5.0</Version> 
</RuntimeInfo> 

や情報を持つ他と 1つのXMLフォーマットされたファイル私が興味を持っているのは、これが共効値を示すデータであり、私は訓練モデルを更新するときに個々の共効値がどのように変化するかを追跡したいと思っています。この出力をキャプチャする方法。

私の質問は、紺碧のデータ工場を使用して紺碧のML実験で単一のWebサービスの出力から複数の出力を取得する方法がありますか? これを解決するには全く異なる方法がありますか?

私はeveryonesのフィードバックを感謝し、AzureのML Studioで事前に

+0

こんにちは、JSONファイルを取得することで達成しようとしていることをさらに説明できますか? ADFを使用したML実験の再トレーニングの通常のプロセスは次のとおりです。 トレーニングデータ - > MLモデルへのフィード再学習エンドポイント - > iLearner - >スコアリングエンドポイントを更新するには、これを使用します。 スコアリングエンドポイントが更新されたら、スコアリングエンドポイントを使用して新しい入力をスコアリングすることができます。 – DataGeek

+0

@DataGeek提案をいただき、ありがとうございます。私の更新を要約するために、私はこれが共有効値を含むものだと思うので、このファイルを望んでいます。これは私の訓練データを変更すると変わり、それを追跡したいと思う。 – Glasody

答えて

0

をありがとう、あなたは、複数のWebサービス出力モジュールを取り付けることにより、複数の出力を持つWebサービスを作成することができます。これらのモジュールの出力は、Webサービスの呼び出し時にJSON形式で返されます。また、複数のデータエクスポートモジュールを使用して、複数の結果をAzureストレージなどに書き込むこともできます。