2011-06-09 3 views
3

ウィキペディアの記事は編集されます。彼らはそれをサポートするために使用されるファイルシステム/データベースストレージのレイアウトなどを拡大/縮小/更新することができます。データベースコースでは、可変長レコードを少し読んでいましたが、それは小さな文字列ではなく、文書全体ではないようです。ファイルシステムの場合と同様に、ファイルは拡大/縮小することができます。ブロックを連鎖させることでファイルが完成すると思います。毎回ファイルを更新しますが、ファイル全体が書き換えられるわけではありません。おそらく類似のものがここで行われるでしょう。ウィキペディアで記事を保存するために使用されるデータストレージモデル

私は特定の名前や用語を探していますが、mysqlのスキーマがどのように定義されているのかも知れません。 (私はウィキペディアがmysqlを使用していると思う)。

以下はWikipediaのアーキテクチャ上のいくつかの過去記事へのリンクですが、私はこれらの中から、私の質問に答えることができないのです。

http://swe.web.cs.unibo.it/twiki/pub/WikiFactory/AntonelloDiMuroThesis/Wikipedia-cheapandexplosivescalingwithLAMP.pdf

http://dom.as/uc/workbook2007.pdf

おかげで、

答えて

4
+0

OK、** text **テーブル:old_id:(整数8)、old_text(ミディアブブロブ)、old_flags(tinyblob)に記事のテキストが含まれていますか?ミディアムブロブとは何ですか? sthはmysqlに関連していますか? – xyz

+0

大丈夫、ちょうどインターネット上では中くらいのものが読まれています。おそらく、これは私の質問への手がかりを持っています。これは私に不思議ですが、mysqlはどのように内部的にmediumblobを実装していますか?どのように中のどこかの記事の編集を扱うなど。それに関するすべてのポインタ? – xyz

+0

ブロブはバイナリ文字列です。データベース内に複数の文字セットを持つ可能性があるため、ここではテキストフィールドの代わりにテキストフィールドが使用されていると思います。そうすれば、誰もが幸せになれます。最も重要な[docsによる]テーブル(http://www.mediawiki.org/wiki/Manual:Database_layout)は、page、revision、pagelinks、およびtextです。 –

関連する問題