ここで私が聞いているのはかなり一般的なはずですが、私の意図はそれを行う最良の方法を理解することです。正規表現でJavaを使用してファイルを検索
- は、私はファイルのリストを持っているディレクトリ内の(nは言う) - すべてが は拡張子によって分類されています。
- 私は、特定のタイプのすべてのファイルで検索したい正規表現パターン(mなど)を含むcsvファイルを持っています。
- 私はRegexパターン、ファイル名、 行と行番号が記載されている最終的な出力を得たいです。ここで
私はこのアプローチすべきかについて私が持っているいくつかの質問です:
- は私がm * n個の操作を避けることができ方法はありますか?
- ファイルを読み込み、コンテンツをバッファリングし、各行をすべての正規表現の検索前に配列に格納するか、正規表現パターンを取るべきか、ファイルを1行ずつ読み込み、検索せずに検索しますアップメモリ?
- 私は読み取り/書き込み操作が最も課税対象であることを理解しています。したがって、最後にn + 1個の読み取り(ファイル、csv)と1回だけの書き込みが必要です。私の前提とアプローチは正しいのでしょうか?
- 配列、リスト、ハッシュマップ、何か他のもの - タスクを完了させる最良の方法は何ですか?私は、ファイルを解析することが効率の鍵となると思いますか?
- コードを大幅に削減できる「珍しい」Java APIはどれですか?
私はこの質問に関する洞察力/助けを感謝します。
。
http://stackoverflow.com/questions/6222659/java-grep-libraryでも、grepを使用しないのはなぜですか? –