2009-06-24 7 views
5

トピックマップを作成してコンテンツを陳腐化しようとしています。 コンテンツを索引付けするためのトピック階層を構築する

は、例えばトピック「アートは、」私は、いくつかのオンラインリソースをクロールしてきた「美術史」、「絵画」「彫刻」などなど

のサブカテゴリーがあるかもしれませんが、私がヒットしましたどのように私は階層を使用したいのかに関する問題。

トピックでインデックスを作成するコンテンツがたくさんあります。したがって、上記の例を挙げると、ユーザーが 'Art'を検索すると、 'Art'という言葉だけでなく、 'Art'という言葉がなくても、 'Painting'という言葉は何も出ません。けっこうだ。

しかし、私の階層の別の部分では、私は「ハウスメンテナンス」を持っているとしたら、それは「絵画」のサブトピックを持つかもしれません。

しかし、ユーザーが「アート」を検索した場合、私のエンジンは「よく、絵画は「アート」のサブカテゴリです。あなたのペイントに最適な色のすべてバスルームの壁....

誰もが前にこの問題を遭遇しましたか?私はグーグルで試してみましたが、正確な用語を知らなくても頭を悩ませました....

編集:もっと「絵画」は「アート」のサブトピックですが、「絵画」についてのサブトピックそれは「アート」が「絵画」の唯一の親ではないので、それは「アート」についてのそれに続いている。

答えて

0

ハウス/絵画とアート/絵画を別々に処理したいので、ペイントのために2つの異なるエントリが必要です(各意味ごとに1つずつ)。与えられた「テキストの塊」を関連付けるものは、あなたのテキストプロセッサが十分に強力であれば、テキスト自体からのコンテキストの手掛かりに基づいています。

たとえば、このような競合が発生した場合はいつでも、テキストを見てください。そこに他の単語がありますか? 'シンク'、 '壁'、 '硬い木'、 '窓'など?あるいは、「モネ」、「印象派」、「キャンバス」、「ギャラリー」のような他の言葉が見えますか?それはあなたが決定を自動化することを可能にし、かなり正確でなければなりません。唯一の欠点は、これはあなたがどこかにある "関連用語"のかなり健全な辞書を持っていることを前提としていることです。

ペイントが選択されている場合は、すべての結果をまとめて結合するか、結果を表示する親トピックを選択するオプションを提示するだけです。

+0

さまざまな用語の使い方を改善しました。 「絵画(装飾)」と「絵画(美術)」。これは愚かな知覚です、私は知っています、彼らがどのように差別化できるかの一例です。 – helcim

0

具体的な名前はわかりませんが、本当に問題になるとは思いません。それが要求するのは、アート/絵画とハウスメンテナンス/絵画は別々のエンティティとして理解されるということです。アートを探している人は、アートのサブカテゴリを取得しますので、アート/ペイントを取得します。 「ハウスメンテナンス」を探している人は、ハウスメンテナンスのサブカテゴリを取得しますので、ハウスメンテナンス/ペイントを取得します。 「絵画」を探している人は、アート/絵画とハウスメンテナンス/絵画を取得します。これは適切です。

+0

問題は私のコンテンツは何のコンテキストを持っていないということです - 私は、テキストのみの塊を持っています。したがって、テキストの一部に「絵画」と記載されている場合は、アート/絵画ノード、またはHM /絵画ノードで表示する必要がありますか?または両方? – PaulJWilliams

+0

ああ、そうだ。私はあなたが自動分類について話していることを理解していませんでした。それは私があなたにGoogleを提案するという言葉です。 – chaos

2

作成しているトピックマップがTopic Maps technologyに基づいている場合、subjectIdentifierを使用して、実際には2つの異なる科目(アートフォームと同じ絵を描いています。家の改築という意味での絵画)。

誰かがアートを検索し、ペイントまで掘り下げた場合、それらのペイントエントリは1つのヒープ上で一緒に投げられなくなるため、「アートフォームとしてペイントする」に関連するエントリだけを返すことができます。

2

このパーティーに遅れてしまった(あなたはすでにそれを構築している、または移動した、または回答を見つけただろうが)私はハイエンドトピックマップベースのCMSで作業していた2セントを投げたいと思った。

あなたの説明に欠けているものは、どのようにトピックがリンクされているかです。トピックは、それ自体がタイプとロールを持つアソシエーションを介してリンクされています。だからはい絵は芸術家の家庭保守の子供であろうが、彼らは異なったつながりを持つだろう。

あなたのタイプと役割を定義することは本当にあなた次第です。ハードとファーストルールはありません。だから、

トピック:アート

協会:ソース=アート、リファレンス= Painitng、タイプ=文化、役割=実践

トピック:ハウスメンテナンス

協会:Soruce =ハウスメンテナンス、リファレンス=絵画、タイプ= DIY、ロール=アクティビティ

私は分類で吸いますが、うまくいけば私は何を得ているのか分かります。タイプと役割に基づいて検索を絞り込みます。だから誰かがアートを検索して絵を返すと、深く掘り下げて共同関連の話題を返そうと思ったら、カルチャー関連のトピックを返すことを話しています。DIY関連のトピックではありません。

トピックマップ正しく実行された場合、非常に柔軟性があります。また、正しいとすれば、スコープと言語も焼き付けられています。同じトピックを100の異なる方法でリンクし、出発点に応じてデータを異なる方法で表示することができます。 「トピックマップ」で

3

、それはあなたがトピックに異なる「スコープを」に設定することができ、関連する標準に理解されるように。だから、 "絵画"は異なる意味を持つ2つのスコープの一部であるかもしれません。

トピックマップ: http://www.ontopia.net/page.jsp?id=vizigator

範囲: http://www.ontopia.net/topicmaps/materials/tao.html#stp-scope

+1

妥当な答え - これを解決するにはスコープが適しています。つまり、家の下にある絵画トピックは「国内」ですが、アートの下にある別の絵画トピックはスコープ「文化」になります。誰かが壁全体を覆うように働く壁画などの芸術的描写を持っている場合、それは両方のトピックの下に分類することができます。トピックマップエンジンは、トピックごとに固有のサブジェクトIDを使用して2つのトピックを分離して保持します(サブジェクトは実際のもの/概念です)。 – RichVel

関連する問題