Javaで複数行のテキストを検索するにはどうすればよいですか?
Table name goes here
Page 1
This is column one This is This
This is column is column
column two f thre f three f
and hal f
Row1 in column 1 Row2InCol2 Row3 Row4InCol4
Page 2
This is column one This is This
This is column is column
column two f thre f three f
and hal f
Grand Total: - 12 13 25
私は列を検索したい
私は、私はこのテキストを見つけたときに、このような方法で、「これは列が3 FとHALのfは」テキストファイルに次のヘッダーを持つテーブルを考えてみましょうこの列が開始されたString索引の位置(「This」の索引)およびこの列が終了した索引の位置(「hal f」という語が終了した索引、つまり「f」の索引)を取得できます。すべての列には「This」と「f」という文字が含まれており、上で説明したのと同様の方法で列の開始インデックスと終了インデックスを検索できるはずです。
私は、列ヘッダーと列データのインデックス位置がページ間で一貫していないテキストファイル内のテーブルを解析できるパーサーを実装したいと考えています文字はページの終わりを示します)
私はそのようなアルゴリズムを探していません。 PatternとMatcherのクラス(または他のAPI)が上記のように複数行のテキスト検索をサポートするかどうかを知りたいですか?
本当に表はこのように見えますか? –
私は問題を少し良く定義する必要があると思います。列には複数のデータブロックが含まれているのか、ページごとに1つのブロックのみが分かっていますか? – takteek
@Tichodromaはい。私は各列の幅を特定することにもっと関心があるので、列ヘッダーのみを表示し、表のデータは表示しませんでした。一度列の幅を取得すると、各列ヘッダーの開始インデックスと終了インデックス、つまり列の幅を持たせることで、任意の列のデータを簡単に取得できます。 – CKing