0
のような出力を返します。ハイブにテーブルを作成し、外部のcsvファイルからデータを読み込みました。私がPythonからデータを印刷しようとすると、 ['\ x00 "\ x00m \ x00e \ x00s \ x00s \ x00a \ x00g \ x00e \ x00" \ x00 "]" Hive GUIを照会すると、結果は適切です。 PythonプログラムPythonプログラムからのハイブクエリは、 "x00e x00" x00 "
私のpythonコード:
import pyhs2
with pyhs2.connect(host='192.168.56.101',
port=10000,
authMechanism='PLAIN',
user='hiveuser',
password='password',
database='anuvrat') as conn:
with conn.cursor() as cur:
cur.execute('SELECT message FROM ABC_NEWS LIMIT 5')
print cur.fetchone()
出力は次のとおりです。
/usr/bin/python2.7 /home/anuvrattiku/SPRING_2017/CMPE239/Facebook_Fake_news_detection/code_fake_news/code.py
['\x00"\x00m\x00e\x00s\x00s\x00a\x00g\x00e\x00"\x00']
Process finished with exit code 0
私はハイブで同じテーブルを照会するとき、私は次の出力を得る:
CREATE TABLE ABC_NEWS(
ID STRING,
PAGE_ID INT,
NAME STRING,
MESSAGE STRING,
DESCRIPTION STRING,
CAPTION STRING,
POST_TYPE STRING,
STATUS_TYPE STRING,
LIKES_COUNT SMALLINT,
COMMENTS SMALLINT,
SHARES_COUNT SMALLINT,
LOVE_COUNT SMALLINT,
WOW_COUNT SMALLINT,
HAHA_COUNT SMALLINT,
SAD_COUNT SMALLINT,
THANKFUL_COUNT SMALLINT,
ANGRY_COUNT SMALLINT,
LINK STRING,
IMAGE_LINK STRING,
POSTED_AT STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY "," ESCAPED BY '\\';
テーブルをロードするためのcsvファイルがである:
をこれは私がテーブルを作成する方法であります以下のパス: https://www.dropbox.com/s/fiwygyqt8u9eo5s/abc-news-86680728811.csv?dl=0
(1)あなたはモジュールを使用していることもはや維持されていませんhttps://github.com/BradRuderman/pyhs2(2)これは明らかにhiveserver2側のエンコーディングの問題です。 (3)投稿タグを修正します。あなたが与えられた恐ろしい答えの受け入れを取り消す場合、あなたは合理的な答えを得るチャンスを持つかもしれません。 –
@DuduMarkovitz:こんにちはDudu、問題の解決策を提供してください –