私はテキスト内の各トークンを分析し、それが地理的場所または場所(都市、国など)であるかどうかを知りたいと思います。場所または場所のデータベース
ダウンロード可能な場所と場所のデータベースはありますか?
私はテキスト内の各トークンを分析し、それが地理的場所または場所(都市、国など)であるかどうかを知りたいと思います。場所または場所のデータベース
ダウンロード可能な場所と場所のデータベースはありますか?
OpenStreetMapプロジェクトの場所名のデータベースを調べる必要があります。いわゆるNominatimを検索してニーズに合っているかどうかを確認し、そうであればOpenStreetMap dataをダウンロードしてください。 OSMを使用する最も一般的な方法は、データをPostgreSQLデータベースにロードすることです。完全な地理的地図レンダリング機能を必要としない場合は、おそらく地名を抽出するだけです。
すべてのOSMデータのファイルは巨大ですが、個々の大陸、国、都市の入手可能な抽出があります。
おそらく、これを独自のロール:
チェックアウトGeonames.org、彼らは世界全体のために正規化された目印の情報を持っています。 The whole world is a 1 GB text fileなど、都市、地方のアトラクションなどdownload specific partsも表示されます。
これは私が使用したものです:Pありがとう – Ema
都市のリストのリンクが動作します! しかし、国のリストは壊れたリンクです。 http://en.wikipedia.org/wiki/ISO_3166-1_alpha-2 または http://en.wikipedia.org/wiki/ISO_3166-1_numeric – Colin