私は正しく理解していれば、収集プロセスをバックアップする処理段階でログジャムを防止することです。前に例を見たことがありますが、基本的には、コレクションの直後にTwitterデータベースが推奨するものに反しているように見えるMySQLデータベースに書き込みます。
私はいくつかのアドバイスや助けをしたいと思っていますが、これを処理する最良の方法は何ですか。すべてのデータをテキストファイルに直接書き込んでから別の関数で解析/処理することをお勧めしているようです。しかし、この方法では、私はそれがメモリ豚かもしれないと思います。
これはキャッチです。すべてがデーモン/バックグラウンドプロセスとして実行されます。だから、誰かがこのような問題、またはより具体的には、Twitterのphirehoseライブラリを解決することで任意の経験を持っていますか?ありがとう!
いくつかの注意: *接続はソケットを介して行われるので、ファイルは常に添付されると思いますか?他の人にフィードバックがあるかどうかわからない