2016-07-13 10 views

答えて

0

基本的なハイブ関数から、コードarray("he", null)は、最初の値が文字列 "he"で、2番目の値がnullの2要素配列を作成するだけです。あなたは「それはcontext_ngrams機能のために何をするのか」を意味する場合

、彼らは(少し再フォーマット)以下の記述持ってHive statistics page上、その後のドキュメント:

SELECT context_ngrams(
    sentences(lower(tweet)), 
    array("i","love",null), 
    100, [, 1000] 
) FROM twitter; 

上記のコマンドリストを返します。 Twitterのつぶやきの架空のデータベースで "i love"というフレーズに続く上位100語のうち、各ヌルは、推定するn-グラム成分の位置を指定する。したがって、すべてのクエリはコンテキスト配列内に少なくとも1つのnullを含む必要があります。

したがって、例の場合、クエリは単語「he」に続く上位10語を返します。