私はテキストファイル内の文字列のパターンを探すプログラムをJavaで作成しようとしています。 小説から取った次のテキストを考えてみましょう。テキスト内の文字列のパターンを検索する
彼女はとても素晴らしい女性でした。彼女は言った: "こんにちは、私の名前はローレン、あなたのものは何ですか?"
HELLO、任意の文字列、NAME(リストから取得したもの)というように、この一連の単語を見つける方法を探したいので、上記の例では太字):
彼女はとても素晴らしい女性でした。彼女は言った: "こんにちは、私の名前はローレン。あなたは何ですか?
最初は正規表現の使用について考えましたが、パーサー(おそらくJFlexまたはANTRLが生成したもの)を書くことを検討しました。
コード作成の方が簡単で、うまくいけば解決方法がわかりますか?
ありがとうございました。あなたの答えは私の仕事にとても合っているようです。私は、スタンフォードPOSタガーを詳細に勉強します。 Btw、これまで使ったことはありますか?もしそうなら、あなたはカスタムタガーファイルを作成したことがありますか?再度、感謝します。 – Sibby
あなたはカスタムタグャーファイルを必要としません。タグャーで使用されているタグセットを適切に調べれば、あなたが望むものを達成することができます。例えば、あなたが与えた例では、特定のタグの下で名前が適切な名詞の下に落ちると、タグセットをテストし、細かいことを行う必要があります。検索をさらに飽和させるには、特定の正規表現パターンを使用してパターンとマッチャーでタグ付けを試みます。 –