2011-12-05 1 views
5

私はmediawiki apiで検索したページを解析する.Netライブラリはありますか?タイトルとデータを純粋なデータで与えることができる標準のメディアウィキパーサーはうまくいくかもしれませんが、ウィキメディアに特別に適したもの、それがどのようなタイプの単語であるのか、すべての定義を与えることができるものがあります。Parseウィキトーライナー

私はこれのために私自身のパーサーを書いてほしくはありません。助言がありますか?

+1

APIからどの出力形式を使用していますか?現在選択しているのは9つです... –

+0

@Alex例は数多くあり、ここから始めてください:http://www.mediawiki.org/wiki/API:Parsing_wikitext –

+0

私はAPIやクライアントライブラリを知らないWiktionaryデータを構造化された形式(HTMLやraw wikitextではなく)で提供します。それではまた、私は本当にあまり見なかった。 –

答えて

2

JSONで出力を取得すると、.NETに組み込まれていてフレームワーク自体の外部にある多くのオプションが使用できます。

XMLで出力を取得した場合でも、.NETフレームワーク自体とフレームワーク外の強力なXML操作クラスがあります。

もっと具体的にする必要があります。形式と出力例を提供してください。

+1

私はこれを使用します:http://ja.wiktionary.org/w/api .php?action = query&prop = revisions&rvprop = content&titles =これは、ページを作るためにmediawikiに入力するコードと同じコードであるwikiコードで提供されます。 – Bananable

1

dbnaryプロジェクトは、RDF形式のウィクショナリーの解析情報を提供します。

さらに処理したい場合は、WikDictプロジェクトの一部としてdbnaryデータから生成されたSQLiteおよびTEIファイルをdownload.wikdict.comに提供します。

これは本当に.netライブラリの質問には答えませんが、XML(TEI)、SQLite、またはRDFを読むライブラリを簡単に見つけることができます。