Parseウィキトーライナー

私はmediawiki apiで検索したページを解析する.Netライブラリはありますか？タイトルとデータを純粋なデータで与えることができる標準のメディアウィキパーサーはうまくいくかもしれませんが、ウィキメディアに特別に適したもの、それがどのようなタイプの単語であるのか、すべての定義を与えることができるものがあります。Parseウィキトーライナー

私はこれのために私自身のパーサーを書いてほしくはありません。助言がありますか？

出典

2011-12-05 Bananable

APIからどの出力形式を使用していますか？現在選択しているのは9つです... –

@Alex例は数多くあり、ここから始めてください：http://www.mediawiki.org/wiki/API:Parsing_wikitext –

私はAPIやクライアントライブラリを知らないWiktionaryデータを構造化された形式（HTMLやraw wikitextではなく）で提供します。それではまた、私は本当にあまり見なかった。 –

JSONで出力を取得すると、.NETに組み込まれていてフレームワーク自体の外部にある多くのオプションが使用できます。

XMLで出力を取得した場合でも、.NETフレームワーク自体とフレームワーク外の強力なXML操作クラスがあります。

もっと具体的にする必要があります。形式と出力例を提供してください。

出典

2011-12-05 23:43:21

私はこれを使用します：http://ja.wiktionary.org/w/api .php？action = query＆prop = revisions＆rvprop = content＆titles =これは、ページを作るためにmediawikiに入力するコードと同じコードであるwikiコードで提供されます。 – Bananable

dbnaryプロジェクトは、RDF形式のウィクショナリーの解析情報を提供します。

さらに処理したい場合は、WikDictプロジェクトの一部としてdbnaryデータから生成されたSQLiteおよびTEIファイルをdownload.wikdict.comに提供します。

これは本当に.netライブラリの質問には答えませんが、XML（TEI）、SQLite、またはRDFを読むライブラリを簡単に見つけることができます。

出典

2016-09-26 12:57:51

Parseウィキトーライナー

答えて

関連する問題