正規表現を使用してPerlで2つの区切り文字の間の値を取得しようとしています。私はファイルを開き、chompを使ってファイルを1行ずつ調べています。ファイルがどのように見えるかの例:コンパイル済みの行からPerlの区切り文字間の値を取得する
"This is <tag> an </tag> example
of the <tag> file </tag> that I
am <tag> trying </tag> to <tag> parse </tag>"
私は単語の最初のカップルを取得することができています:「」、「ファイル」を、私は唯一の獲得「しよう」とすることはできません3行目の「解析」 。私は、これはchomp
とは何かを持っている疑いがあるが、異なったファイルを解析する方法を見ていない
while (chomp($line = <$filename>)){
($tag) = $line =~ m/<tag>(.*?)<\/tag>/;
push(@tagarray, $tag);
}
:これは私が使用しようとしていますコードです。
[HTML :: TreeBuilder](http://search.cpan.org/~kentnl/HTML-Tree-5.07/lib/HTML/TreeBuilder.pm)(HTML用) – zdim
あなたの場合HTMLやXMLを処理している場合は、正規表現パターンを使用して独自のライブラリを作成するのではなく、その目的のためにライブラリを使用する必要があります。 – Borodin