私は、列1(文字列はスペースで区切られた例:United Nations)の組織のリストを持っていて、関連するURL(www.un.org/など)列1は検索文字列としての値です。ジオコーディング手順はかなり簡単です(http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial#Geocoding_names_and_addresses)ので、Google検索や他のWebサービスを使用してこのタスクを実行する方法があるのだろうかと思います。ヒット・アンド・ミス・アプローチですが、手作業での編集に勝ちます。ありがとう!openRefine上の単語リストからURLを取得する
0
A
答えて
0
具体的な例がなくても広範な質問に答えることは難しいです。もちろん、Open Refineを使用して、大量のAPIを使用してデータを豊かにするか、Webスクレイピングを行うことができます。ほとんどの場合、手順はほぼ同じです.URLを再構築し、「URLを取得して列を追加」し、HTML、XML、またはJSONファイルの結果の列を解析します。
ここでは、名前のリストからWikipedia search APIを呼び出す方法の例を示します。 URLを再構築
は非常に簡単です:
"https://en.wikipedia.org/w/api.php?action=opensearch&search="
+ value.escape('url')
+ "&limit=10&namespace=0&format=xml"
何、value='United Nations'
ため、これを与える:XMLコンテンツはその後、抽出するために解析できる
あなたが必要とするアイテム。たとえば、Wikipediaのページの説明を得るには、
value.parseHtml().select('Description').htmlText()
関連する問題
- 1. 単語のリストから最長の単語を取得
- 2. 単語リストから特定の長さのランダムな単語を取得
- 3. Linqリストから単語を取得する
- 4. pyspark word2vecモデルから単語リストを取得する方法は?
- 5. javascript:単語とスラッシュの間にURLからIDを取得
- 6. 単語リストの辞書から値を取得する方法は?
- 7. 全文検索辞書から単語リストを取得する方法
- 8. Haskellのリスト内の単語の長さを取得する
- 9. URLからSharePointリストを取得
- 10. Prolog:合計X音節の単語のリストを取得する
- 11. 特定の単語のリストを取得するには?
- 12. LuceneのSpanNearQueryから一致する単語を取得する
- 13. 複数のリストから同じ文字で始まるすべての単語のリストを取得する
- 14. 英語のバージョンから "Speaking URL path segment"を取得する
- 15. 変数から一致する単語数を取得する
- 16. AndroidのCurrentInputConnectionから単語を取得する方法は?
- 17. stringから特定の単語を取得するORACLE
- 18. WordNetから単語の定義を取得する方法
- 19. ループ/プリントから特定の単語を取得する
- 20. java最後の単語を文字列から取得する
- 21. テキストファイルから単一リンクリストへの単語の取得方法
- 22. Hadoop Mapleduceで最大の単語を取得する単語数
- 23. .htaccessでURLから言語を取得する
- 24. Twig - 文字列から単語数を取得する
- 25. Word2Vecモデルから単語頻度を取得する方法
- 26. EditTextから単語を取得する方法は?
- 27. gensim Doc2Vecから単語ベクトルを取得するには?
- 28. 単語の文脈を取得する
- 29. 単語の同義語を取得
- 30. firebaseリストから単一のアイテムを取得する
ありがとう。これはウィキペディアのAPIと完全に連携しています。あるいは、私が前に気にしていたように、Googleマップを使っています。しかし、私はそれをGoogleの検索と連携させることはできません。 – Herbert
"http://www.google.com/uds?action=opensearch&search=" + value.escape( 'url')+ "&limit = 10&namespace = 0&format = xml"を試してみました。 私はCSE(カスタム検索エンジン)とそれに対応するAPIキーと検索エンジンIDを代わりに使うと思います。しかし、これらをコードに追加する方法はわかりません。私はこれを試してみました(そして失敗しました):https://www.googleapis.com/customsearch/v1?key=KEY_HERE&cx=CX_HERE?action=opensearch&search=United+Nations&limit=10&namespace=0&format=xml – Herbert
私は誤解があると思います。メソッドは、私はウィキペディアのURLで動作する説明した。別のサービスの場合は、別のURLを使用します。 「Opensearch」または「xml」はgoogle.comでの検索で意味をなさない。とにかく、あなたはGoogleを掻きすることはできません。 Googleは世界で最大の詐欺師であり、誰もそれを同じようにすることはできません。いくつかのGoogle APIを使用する必要があります。 –