Objective-Cにアクセス可能な既存のライブラリがあるかどうかは、this oneのような書式のページを掻き集めることができますか?具体的には、各日付の隣にあるすべての日付およびすべてのテキスト。そうでない場合は、これを行う最善の方法は何でしょうか?正規表現ですか?私はNSString
に既にこのための組み込みメソッドがあると聞きました。これは本当ですか?Wikipediaを掻き集めて解析するページ
XMLファイルやAPIなど、スクレイピングの代替手段があるかどうかを調べていました。私はAPIを見つけましたが、利用可能なクライアントは他の言語であり、ページにコンテンツを投稿できるだけで、取得できないようです。
EDIT:だから私は、これらのリンクのAPIに関するより多くの情報を見つけました:
そして、私はいくつかのHTMLを返すthis requestを思い付くことができましたエンコードされたテキストです(形式はXMLですが、»a href=
などのページのテキストも含まれています) eこれはもう少し良くなっていますが、そうでない場合は、これを解析するための推奨事項がありますか?
EDIT 2:よし感謝this doc pageにので、私はデータを取得することができましたもっともシンプルでクリーンな方法は、関連セクションの(wikiマークアップで)生データを返します。このconstructed linkを使用しています。しかし、私はそれを解析する必要があると思いますが、実際にそうであれば記事全体よりもはるかに簡単になるはずです。
Objective-Cで次のようなwikiマークアップの解析に関する推奨事項はありますか?
==Events==
* [[710]] – [[Saracen]] invasion of [[Sardinia]].
*[[1275]] – Traditional founding of the city of [[Amsterdam]].
*[[1682]] – [[Philadelphia]], [[Pennsylvania]] is founded.
私が持って終了したい何を、私は情報の添付スニペットに日付を格納しますNSDictionary
または類似のコレクションを推測します。ありがとう!