2

私は主に、非集中化、正規化されていない、完全に公開されたユーザ提出タグからのアクセス方法についての議論を探しています。それらをセマンティックに組み合わせることですべてを理解し始めます。 「クラスタ」と呼ばれるグループです。flickrのタグをクラスタリングするシステムの実装方法に関するアイデアはありますか?

実際の人々が実際にどのようなタグを使用しているかを把握するのは簡単ですか、タグの頻度を自動的に分析するだけで簡単に行うことができますか?

そのようなもの。荒々しく詳しいことは自由に感じてください:)(これについては他のところで議論されていれば、それについて聞きたいです)。

答えて

3

この記事を読む:Automated Tag Clustering既存のアプローチの概要を示し、タグクラスタリングのアルゴリズムについて説明します。

+0

私が探していたものとまったく同じ種類のものです。ありがとう! –

+0

提供されたリンクはもう動作しません。[このリンク](http://tagging.pui.ch/automated_tag_clustering)は、上記の記事を表すようです。 – martin

1

Algorithms of the Intelligent Web(マニング)(特に第4章)、O'Reillyの類似のタイトルの本はクラスタリングアルゴリズムをカバーしています。 Manningの書籍は、素朴なSQLアプローチから始まり、K-means、ROCK、DBSCANに移行します。タグに焦点を当てるよりも一般化されていますが、そのコンテキストでは簡単に適用できます。コードはJavaで表示されますが、Rubyに容易に適合します(Javaコードを問題に適応させるよりも簡単な場合もあります)。

第5章では、ビルディングトポロジに関する分類とベイジアンアルゴリズムについて説明します。

関連する問題