私はmediawiki apiで検索したページを解析する.Netライブラリはありますか?タイトルとデータを純粋なデータで与えることができる標準のメディアウィキパーサーはうまくいくかもしれませんが、ウィキメディアに特別に適したもの、それがどのようなタイプの単語であるのか、すべての定義を与えることができるものがあります。Parseウィキトーライナー
私はこれのために私自身のパーサーを書いてほしくはありません。助言がありますか?
私はmediawiki apiで検索したページを解析する.Netライブラリはありますか?タイトルとデータを純粋なデータで与えることができる標準のメディアウィキパーサーはうまくいくかもしれませんが、ウィキメディアに特別に適したもの、それがどのようなタイプの単語であるのか、すべての定義を与えることができるものがあります。Parseウィキトーライナー
私はこれのために私自身のパーサーを書いてほしくはありません。助言がありますか?
JSONで出力を取得すると、.NETに組み込まれていてフレームワーク自体の外部にある多くのオプションが使用できます。
XMLで出力を取得した場合でも、.NETフレームワーク自体とフレームワーク外の強力なXML操作クラスがあります。
もっと具体的にする必要があります。形式と出力例を提供してください。
私はこれを使用します:http://ja.wiktionary.org/w/api .php?action = query&prop = revisions&rvprop = content&titles =これは、ページを作るためにmediawikiに入力するコードと同じコードであるwikiコードで提供されます。 – Bananable
dbnaryプロジェクトは、RDF形式のウィクショナリーの解析情報を提供します。
さらに処理したい場合は、WikDictプロジェクトの一部としてdbnaryデータから生成されたSQLiteおよびTEIファイルをdownload.wikdict.comに提供します。
これは本当に.netライブラリの質問には答えませんが、XML(TEI)、SQLite、またはRDFを読むライブラリを簡単に見つけることができます。
APIからどの出力形式を使用していますか?現在選択しているのは9つです... –
@Alex例は数多くあり、ここから始めてください:http://www.mediawiki.org/wiki/API:Parsing_wikitext –
私はAPIやクライアントライブラリを知らないWiktionaryデータを構造化された形式(HTMLやraw wikitextではなく)で提供します。それではまた、私は本当にあまり見なかった。 –