1
HadoopでJsonファイルを処理するためにPythonコードを使用してMapperを書き込む方法。 Iコードの下にしようとした:シェルコマンドcat user_info.json | python mapper.py
を使用して、上記のコードの実行に関するjsonファイル用のストリーミングmapreduceジョブをPythonで書く方法は?
import json
import sys
data = json.loads(sys.stdin)
、それが表示されているエラー:
Traceback (most recent call last):
File "mapper.py", line 6, in <module>
data = json.loads(sys.stdin)
File "/usr/lib64/python2.6/json/__init__.py", line 307, in loads
return _default_decoder.decode(s)
File "/usr/lib64/python2.6/json/decoder.py", line 319, in decode
obj, end = self.raw_decode(s, idx=_w(s, 0`enter code here`).end())
TypeError: expected string or buffer