2009-07-29 19 views
8

特定の文字列が地理的な場所に関連するかどうかを判断するためにどのような作業が行われましたか?たとえば:テキスト内の地理的位置を特定する

'troy, ny' 
'austin, texas' 
'hotels in las vegas, nv' 

私は一種の期待していどのような推測は、最初の2つの場所であることを確信の度合いを与える統計的手法です。最後のものは、おそらく "%s、%s"をつかみ、同じテクニックを使うヒューリスティックを必要とします。私は特に、 "in"命題にあまり依存していないアプローチを探しています。それは、完全に明確でないか、一貫して利用可能な場所の指標ではないことがわかります。

誰かが私にアプローチ、論文、または既存のユーティリティを指摘できますか?ありがとう!

答えて

7

は、XMLやJSON文書として 検索語見つかり名

例を返します。地理的な質問の構文解析またはより一般的な地理的な情報検索が含まれる。

CLEF 2007(http://www.uni-hildesheim.de/geoclef/2007/Query-Parsing.htm)でこれを行うことに関する最近の課題がありました。勝利したチームはルールベースの文法を使用しました。これはおそらく望ましくないものに似ています。 www2009の別の論文はGeoParser:http://www2009.eprints.org/239/について語っています。

CIKM 2007年地理情報検索上のいくつかの論文もありますhttp://www.geo.unizh.ch/~rsp/gir07/accepted.html

私はこれを行う任意のオープンソースソフトウェアを知りませんが、それはキツネザルのような検索エンジンにバンドルすることができます。

3

支援するためのリンク:geonames.org search:あなたが記述問題が頻繁に呼び出されhttp://ws.geonames.org/search?q=troy,%20ny&maxRows=10

+3

そのマップ上で見つけることができます(現在はグローバルカバレッジを提供するために、すぐに、約50のヨーロッパ諸国をサポートしています)geocode.xyz

を無料geoparserを構築しています個々の文字列を場所に変換することはできますが、任意のテキスト内の場所を見つけるのには役立ちません。 – jpatokal

4

Everyblock.comが取り組んでいる非常に興味深いアプローチは、場所が英語でどのように表現されるかに焦点を当てています。基本的には、現在オープンソースの洗練された広範な正規表現を使用しています。彼らのアプリケーションは、ニュース記事、レビュー、およびさまざまな公開データフィードをスキャンし、それらを特定の場所に関連付けるように設計されており、うまく機能します。 「サンフランシスコの20th北東コーナーとValencia St.の建物の火災」などの表現は非常に正確にジオコードされています。ソースhereを調べることができます。具体的には、ebpub/ebpub/geocoder/base.pyがあり、ebpubのダウンロードとその周りのすべてにあります。たとえば、SmartGeocoderクラスから始まり、後方に向かって作業します。

0

私はgeoparsingのサンプルアプリケーションがOpenWikiMap

関連する問題