2016-10-21 16 views
2

H2OのREST APIを使用してH2OFrameを作成することは可能ですか?H2O REST APIを使用してH2OFrameを作成する方法

私の主な目的は、外部 H2OFramesの予測をするために、H2O内に格納されたモデルを利用することです。

私は(私は、エンドポイントを呼び出すことによって仮定)JSONから外部にそれらのH2OFramesを生成できるようにする必要があり

私はAPIドキュメントを読むが、任意の明確な説明を見つけることができませんでした。

私は最も近いエンドポイントがランダムデータと/3/ParseSetup

を作成しますが、私は任意の信頼性のチュートリアルを見つけることができませんでした

/3/CreateFrameであると考えています。

+0

フレーム内で必要なデータについて詳しく説明できますか。ランダムなデータになりますか?または、それは実際のデータですか、あなたは現在、いくつかのファイル形式(またはSQL DB)を持っていますか? –

+0

@Darren_Cookこのような機能に基づいて何かを予測するために、h2oモデルで必要とされるのと同じ番号とプロパティ名を持つjsonを渡して、小さなデータフレームを作成したいと考えています。 –

答えて

3

現在、一部のJSONレコードをFrameオブジェクトに直接変換するREST APIエンドポイントはありません。したがって、まずはデータをCSVファイルに書き込んだ後、POST /3/PostFileを使用してh2oにアップロードし、次にPOST /3/Parseを使用して解析します。

POST /3/PostFileエンドポイントはドキュメントに含まれていません)これは、他のエンドポイントからのhandled separatelyであるため、エンドポイントは基本的には投稿要求の本文に任意のファイルをとり、データファイル")。

同じジョブは、PythonまたはRで行う方がはるかに簡単である:例えばスコアリングのためにH2Oにいくつかのデータセットをアップロードするためには、あなただけの私はすでに似た何かをやっている

df = h2o.H2OFrame(plaindata) 
+0

Re: "PostFileはドキュメントにありません"。それは単に「まだ文書化されていませんか」、または公式のインターフェースの一部ではないか(たとえば、将来変更される可能性があります)。 –

+2

@DarrenCook *はパブリックインターフェイスの一部なので、今後変更されることはありません。公式の文書にはまだありません。他のすべてのエンドポイントの標準スキームに従っていないためです。したがって、適切に文書化されているハッキングが必要な場合があります。 – Pasha

0

を言う必要があります私のプロジェクト。 JSONレコードをFrameオブジェクトに直接変換するREST APIエンドポイントがないためです。 -

1-モデルビルドの場合: - h2oサーバーまたはクラスターが実行されているCSVファイルにデータを書き込んでから、POST/3/ImportFilesを使用してh2oにデータをインポートします。モデルを解析してビルドします。私はh2o-bindings API(RESTful API)を使っています。私は大きなデータ(数百MBから数GB)を持っているので、後で/ 3/ImportFilesをPOST/3/PostFileとして使用します。後者は大きなデータをアップロードするのが遅いからです。

2-モデルスコアリングまたは予測の場合 - モデルMOJOおよびPOJOを使用しています。あなたのケースでは、あなたのデータが大きければ、@Pashaが示唆するようにPOST/3/PostFileを使用します。しかし、h2oのドキュメントでは、実稼働環境でモデルスコアリングや予測にMOJOやPOJOを使用し、h2oサーバー/クラスタを直接呼び出さないことをお勧めします。 MOJOとPOJOはスレッドセーフであるため、同時要求に対してはマルチスレッドを使用してスケーリングできます。

関連する問題