は下記の表を想像しハイブSQL:preffix
クエリ以下text
----
h
he
hel // All above are prefixes
helll123 // hel is a prefix of helll123; this is the first occurence of helll123
helll123 // second helll123
f
fa
fals
falst0 // fals is a prefix of falst0
は
SELECT
unique_by_prefix(text) AS unique_text, // pseudo code
count(*)
FROM
my_table
GROUP BY 1
は、以下の結果を生成する必要があります後に私は何を実証するための擬似コードである
unique_text count
helll123 2
falst0 1
基本的に、プレフィックスは無視され、ユニークなテキストのみがカウントされます。
はどのように接頭辞であると単語である伝えることができますすることができますか?いくつかのルールがあるはずです。 –
私は実際にそれが単語であるかどうかを区別しようとしていません。私は質問を更新します。私はプレフィックスなど何でも無視します – samol