私はウィキペディアのすべての死者のリストを抽出し、死亡時の年齢を比較したいと思います。ウィキペディアのすべての死者には、次のフィールドがあります。Wikipediaから統計を抽出するには?
| birth_name = Thomas Alva Edison
| birth_date = {{birth date|mf=yes|1847|02|11}}
| death_date ={{death date and age|mf=yes|1931|10|18|1847|02|11}}
クローラを作成する必要がありますか? Wikipedia APIには私を助ける何かがありますか? クロールを開始できる場所はありますか?死んだ人のリスト?
http://dumps.wikimedia.org/enwiki/latest/
ファイルサイズが数ギガバイトの.xml
ファイルであり、そして上のすべてのページのテキストが含まれています。あなたがここにダウンロード可能なウィキペディアのすべての内容のダンプを見つけることができます
私のクローラの開始ページが見つかりました。それらはhttp://en.wikipedia.org/wiki/Category:1898_deaths –