2012-07-20 2 views
8

Oxford Dictionaryの単語リストに基づいてdictファイルを作成する必要があります。今私はLinuxの単語リストにアクセスできますが、それは私の目的にはあまり適していません。誰かがこれをダウンロードできる場所を知っていますか?グーグルが何時間も例外を投げて例外を投げたようです。Oxford Dictionaryの単語リストファイル

ご迷惑をおかけして申し訳ありません。 乾杯。

+0

apiを提供するオンライン辞書をポーリングして、独自の単語リストを作成できます。 – LanguagesNamedAfterCofee

+3

@LanguagesNamedAfterCofeeこれは私が今までに見た中で最も曖昧なコメントです: –

答えて

11

OEDリストをダウンロードすることはできませんが、利用可能なさまざまな単語リストがあります。しかし、定義から単語を分離するためにいくつかの作業をしなければならないかもしれません。

開始するには良い場所がhttp://www.dicts.info/dictionaries.php

Moby projectでは有望、特に彼らの610,000+単語リスト(そのページの最後のリンク)を探します。

Wikitionary dumpをダウンロードすることもできます。 XMLから単語を抽出する必要があります。

多くの選択肢があります。あなたのニーズに合ったものを見つけることができるはずです。むしろ後半

+0

実際に "Moby Thesaurus"は私に必要なものです。 ;-) – MaYaN

6

が、(いくつかの最小限の解析が必要になりますが)これは、XMLを解析する必要がなく、英語ウィクショナリー内のすべての単語の圧縮されたリストをダウンロードします:

curl http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles.gz ~/Downloads/titles.gz 

そこから、すべての完全に小文字の英文字からなるすべての単語のリストを取得します。このような何かを、

gunzip ~/Downloads/titles.gz 
mv ~/Downloads/titles ~/Downloads/titles.txt 

はリストを解析するために、使用します:あなたは、ファイルを解凍し、それをプレーンテキストファイルを作成している実行する必要があり

grep "^[a-z]\{1,\}$" ~/Downloads/titles.txt | sort | uniq >> ~/Downloads/words.txt 
+0

答えがありがとう、非常に便利 – MaYaN

+2

誰でもここに2016年以降:URLはhttps://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles.g です。http ** s ** – Chewtoy