5

Objective-Cにアクセス可能な既存のライブラリがあるかどうかは、this oneのような書式のページを掻き集めることができますか?具体的には、各日付の隣にあるすべての日付およびすべてのテキスト。そうでない場合は、これを行う最善の方法は何でしょうか?正規表現ですか?私はNSStringに既にこのための組み込みメソッドがあると聞きました。これは本当ですか?Wikipediaを掻き集めて解析するページ

XMLファイルやAPIなど、スクレイピングの代替手段があるかどうかを調べていました。私はAPIを見つけましたが、利用可能なクライアントは他の言語であり、ページにコンテンツを投稿できるだけで、取得できないようです。

EDIT:だから私は、これらのリンクのAPIに関するより多くの情報を見つけました:

そして、私はいくつかのHTMLを返すthis requestを思い付くことができましたエンコードされたテキストです(形式はXMLですが、»a href=などのページのテキストも含まれています) eこれはもう少し良くなっていますが、そうでない場合は、これを解析するための推奨事項がありますか?

EDIT 2:よし感謝this doc pageにので、私はデータを取得することができましたもっともシンプルでクリーンな方法は、関連セクションの(wikiマークアップで)生データを返します。このconstructed linkを使用しています。しかし、私はそれを解析する必要があると思いますが、実際にそうであれば記事全体よりもはるかに簡単になるはずです。

Objective-Cで次のようなwikiマークアップの解析に関する推奨事項はありますか?

==Events== 
* [[710]] – [[Saracen]] invasion of [[Sardinia]]. 
*[[1275]] – Traditional founding of the city of [[Amsterdam]]. 
*[[1682]] – [[Philadelphia]], [[Pennsylvania]] is founded. 

私が持って終了したい何を、私は情報の添付スニペットに日付を格納しますNSDictionaryまたは類似のコレクションを推測します。ありがとう!

答えて

関連する問題