私は、フォーラムで分類広告から価格を解析するスクリプトを書いています。緩やかに構造化されたテキストから価格を解析する
テキストは非常にひどく構造化されていますが、価格が存在する場合もあります。時には、ユーザーは同じアイテムが店内で100ユーロかかるとの発言を追加することもありますが、80ユーロで販売しています。そして私はそのような広告から価格80ユーロを得たいと思っています。
他のケースでは、それぞれ異なる価格の商品を販売していますが、価格の合計を取得したいと考えています。それ以外の場合は、すべての物を買う人に特別価格があります。この場合、通常、すべての価格の合計よりも低い全体セットの価格を取得したいと考えています。
今、私は正規表現の束といくつかのif-sでそれをやっています。このようなことができるアルゴリズムがあるのだろうかと思っていますが、私はそれらを認識していませんか?
それは私には「普通」聞こえません。 – jasonbar