2016-08-15 10 views
2

私は、各記事がノードであるように、グラフ形式でWikipedia全体を表現したいと思います。ある記事に他の記事のリンクが含まれている場合、それらはエッジを共有します。 これはあまりにも多くのヒットになるので、私はローカルでリクエストを行う必要があります(Wikipediaをローカルにセットアップする必要があります)。 これを達成する方法を教えてもらえますか(参考になるライブラリやツールについて教えてください)?Wikipediaをグラフ形式で表現する

答えて

2

here. あなたの 'python'タグから、私はpythonを使ってデータをクロールし、グラフを生成したいと思っています。 私は、以下のモジュールをお勧めすることができます

  • 要求 -
  • Beautifulsoupをウェブサイトを取得するための - beautifulsoup
  • pymongodbための代替 - - 一緒にコースのMongoDBを持つHTML
  • scrapyを解析するために。グラフの可視化と操作
+0

また、グラフのnetworkx - 可視化

  • networkxのためにも良い選択 - 可視化
  • graphvizのために - MongoDBはそれのドキュメント指向の
  • matplotlibのために良い選択です。 –

  • +0

    ありがとう、私はそれをリストに追加しました – user2393256

    +0

    ありがとうたくさんの@ user2393256 – rishabh

    関連する問題