2009-06-28 10 views
0

Brent's answerは、質問を素早く分析できるようにSOの質問のデータベースを作成したことを教えてくれます。PythonでSOの質問のMySQLデータベースを作ることができません

私はBrentと同様のクエリでMySQLを練習できるように、MySQLで同様のデータベースを作ることに興味があります。

データベースには、少なくとも次のフィールドが含まれている必要があります(私の推測では、SOのAPIのAPIはSectetのようです)。私は、ブレントと同様の分析を可能にする関連変数だけを列挙することを目指しています。

  • 質問
  • Question_id(秘密鍵)
  • Question_time

  • コメント

  • Comment_id(秘密鍵)
  • Comment_time

  • USER_ID(PRIブレントのデータベースが明らかに隠されているので、我々は明らかに必要vateキー)

  • User_nameの

はPythonの美しい石鹸でデータをこすり。

どのようにPythonの美しいソープすることにより、このようなMySQLデータベースを行うことができますか?**

+0

なぜデータベースを作成するのですか?検索できるようにデータベースを作成していますか? SOは検索を提供しているので、少しばかげているようです。 –

+0

@ S.Lott:私はMySQLで練習するためにデータベースを作成しています。私は、MySQLでデータ分析を行うことを目指しています。 –

答えて

1

XMLデータダンプ@RichieHindleの言及で直接作業することは可能でしょうが、特に@ nobody_のsqliteバージョンでは非常に幸せでした。特に、sqliteバージョンのREADMEファイルにインデックスを追加した後は嬉しいです。

完全な索引付けされたsqliteバージョンがあり、Pythonタグ付きサブセットをMySQLデータベースにロードする必要がある場合は、2つのDB APIインスタンスを使用してsqlite (個人的には、インデックス構築が完了した時点でsqliteのパフォーマンスは完全に満足のいくものでしたので、サブセットの抽出も他のDBエンジンへの移行も行っていませんでした) - no Souf 目的には石鹸が必要です。いずれにしても、lxmlやallにもかかわらず、XMLから直接ロードするよりもはるかに簡単で高速でした。

もちろん、サブセットロードを実行したい場合や、すべてのコード化で問題が発生した場合は、スキーマとコードのサンプル、エラーメッセージなどがあれば尋ねてください.Soersは答え、いつものように - )

+0

@あなたの答えをありがとう! ---私はこれらの小さな問題を解決し、解決策をSOに投稿するために最善を尽くします。 –

関連する問題