2011-06-28 10 views
3

私は、テキストファイルにJSON文字列として保存されたストリーミング・ツイッターAPIからの大量のtwitterメッセージを持っています。TwitterはJSON StringをJava Object(POJO)にtwitter4j ..のようなものを使って保存しました。

これらのJSON文字列をTwitter4Jステータスオブジェクトのようなものに変換してゲッターとセッターの単純なオブジェクトとして使用する方法を知っている人がいましたか?

ソースをデバッグし、入力ストリームクラスを模倣する独自の注入クラスを作成することを考えていましたが、より良い方法があるかどうか疑問です。

ありがとうございます!

答えて

0

を助けるかもしれない

このスレッドをGoogleのProtobuffやCodehauseのXStreamのか、ジャクソン

を使用して試すことができますが、データで何をしたいのかに依存します。 1つの考えは、すでにJSON http://www.mongodb.org/display/DOCS/Import+Export+ToolsのインポートをサポートしているMongoDbのようなデータベースにインポートすることです。そこからさらにデータを分析または変換することができます

+0

ちょっといいアイデアはすでにこれをしています...問題は、インポートツールがJsonの配列(ネストされたオブジェクトファイル)を最大4MBしか処理できないということです。私は400GBを超えるメッセージを持っています処理する...本当に100,000以上のファイルに分割する必要はありません...どのように私はこのデータをインポートすることができます他のアイデア? – NightWolf