外部REST APIからデータをプルする必要があるDataSet.map
操作があります。マップ/フィルタ/ etcから非同期操作(つまり未来を返す)を実行する方法
REST APIクライアントはFuture[Int]
を返します。
DataSet.map
オペレーションをどういうわけか、このFuture
を非同期で待機させることはできますか?または、Await.result
を使用してスレッドをブロックする必要がありますか?または、これは単に完了したものではありません。つまり、代わりにAPIによって保持されているデータを自分自身のDataSet
に読み込み、join
を実行する必要がありますか?
ありがとうございます!
EDIT:異なり
:Spark job with Async HTTP call
理由:この質問は二DataSet
、代わりにjoin
を使用して、たとえば、異なった問題を解決する方法を議論に開かれています。さらに、リンクされた質問には、Sparkが非同期変換を処理できるかどうか、そして可能であればどのように構造化するべきかについては決定的な答えが含まれていません。
非同期httpコールでスパークジョブを探している人がいる場合のみです。[チェックアウト this](https://stackoverflow.com/a/45946369/150371) – raksja