2012-01-19 1 views
3

イメージにキャプションを含む列があります。私がしたいことは、そのコラムで最も人気のある単語が見つかることです。t-sqlはテキスト列内のユニークワード数をカウントします

t-sqlでこれを行う方法はありますか?

+0

特にT-SQLでは?標準SQLでは十分ではありませんか? – jkj

+0

多分このポスト(http://stackoverflow.com/questions/314824/t-sql-opposite-to-string-concatenation-how-to-split-string-into-multiple-reco)は出発点ですか?そこからあなたのコラムの内容を分割し、グループ化することができますか? – Gorgsenegger

+0

あなたはどのRDBMSを使用していますか? MS SQL 2008? – codingbadger

答えて

3

この記事には、必要なものがすべて含まれていますFast Text Processing in SQL Server これにはSQL Server 2000+および2005+のソリューションが含まれています。

+0

ありがとう - 非常に便利 – derekcohen

0

私はこのようなことができると思います。私はこれが最も最適化されているとは思わないが、あなたはそれを改善することができます。

単語を格納するテーブル変数@tを作成します。 キャプションテーブルの各行をループしてカーソルを作成します。 各行に対して、チャンク分割関数を使用してテーブルを取得します(http://www.sommarskog.se/arraylist-2005/tblnum-functions.html#chunk_split_me) テーブル変数をテーブル変数@tに追加します

@tで単語とカウント(単語)と降順を行います。

+0

私はイゴールの記事を読んで手術する。あなたが与えたリンクは本当に有用ではありません。 –

+0

ありがとうございます。私が言ったように、それは出発点にすぎません。助けてくれてありがとう。 –

関連する問題