Azure Blobsに格納されているIP(Weblogs)を持つavroファイルがたくさんあります。 IPを場所にマップしたいと思います。 Azure Data Lake Analytics(ADLA)でそれを行うにはどうすればいいですか?IPアドレスをAzureデータレイク解析でマップする
今私は、このルックアップを行うためにすべてのip-locationデータを含む113MBの.mmdbファイルを読み込むjavaライブラリでMaxmind IPデータベースを使用するスパークジョブを持っています。私は現在、この仕事をADLAに移すことが可能かどうか調査しています
MaxmindはC#ライブラリも提供しているので問題ありません。しかし、この大きなmmdbファイルをどのように扱うべきかは明らかではありません。このファイルを読み込み、次にルックアップに使用する必要があります。明らかに、各IPルックアップのファイルを読むのは速くないでしょう。これはどのようにしてADLAで処理できるのですか?またはADLAはこの種の操作には適していませんか?
私は通常のプログラム実行を持っていた場合、私はこのような検索を行うだろう:
using (var reader = new Reader("GeoIP2-City.mmdb"))
{
foreach(var ip in ips)
{
var data = reader.Find<Dictionary<string, object>>(ip);
...
}
}
maxmind DBはここにあります:https://dev.maxmind.com/geoip/geoip2/downloadable/(私はイムは、現在使用してデータベースを購入したことに注意してください) とC#ライブラリは、ここでそれを読むために:https://github.com/maxmind/MaxMind-DB-Reader-dotnet
正直なところ、これはデータベース操作のように聞こえます。つまり、ルックアップに参加しますが、私はMaxmindデータについて何も知らないのです。もっと教えていただけますか?あなたはそのファイルを支払ってダウンロードしましたか? – wBob
「通常の」コマンドラインプログラムでデータベースをどのように使用するかについて少し答えを広げました – viblo
ADLAテーブルを使用して大きなファイルを保存したとしたら、ルックアップテーブルと同じように使用しましたか?自然キー検索に似たip(同じ形式を持つと仮定)に基づいて、入力ファイルをADLAテーブルに直接結合することができます。 – jatal