私は一般的に発生するIPアドレスをApacheログから見つける必要があります。ApacheサーバーログからIPアドレスを解析する方法は?
12.1.12.1 9000 127.0.0.1 - フランク[10/10月/ 2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326 「HTTP:// WWW .example.com/start.html " " Mozilla/4.08 [ja](Win98; I; Nav) "
12.1.12.1 9000 192.145.1.23 - フランク[10/Oct/2000:13:55:36 Mozilla/4.08 [ja](Win98; I; Nav) "
"
IPアドレスを抽出するにはどうすればよいですか?各行の3番目の単語)をJavaで正規表現を使用していますか? また、私はロボットアクセスを見つけるために、そこから最も一般的なIPアドレスを見つけなければなりません。 ログには何百万もの行が含まれているので、regexpはこれに適しています。
なぜ正規表現を気にしませんか?部分文字列を2番目と3番目のスペースの間に入れてください。 –
私は何百万本もの線から取り除かなければなりません。 – Anand
いいえAnandいいえ、正規表現には2番目と3番目の領域のインデックスを見つけてから部分文字列に直接アクセスするよりもオーバーヘッドが多いため、何百万行ものデータを取り込むと高速になります。 –