pdfText
という文字列でPDFファイルの全文を取得しました。文字列に長い単語の一部ではない部分文字列と部分文字列が含まれています(完全一致)
次は、pdfText
ストリングで見つけられる/検索される部分文字列を含む配列をループしています。
サブストリングの1つはInvoice
です。
pdfText
と私が探している部分文字列はいずれも小文字に変換されます。
部分文字列のうち少なくとも1つがpdfText
にある場合、ブール値はtrueに設定されます。
ここでは、pdtText
に「...正味金額を請求する...」という例があります。これはテキスト内の「請求書」の唯一の変形です。 これはもちろん、私が使用すると真を返します
substring = "Invoice" ... pdfText.contains(substring.ToLower)
です。
しかし、この場合はfalseを返す必要があります。私は正確なマッチだけを見つける必要があります。
別の例では、pdfText
に '...これは請求書です。お支払いください....正味金額請求書... 'ブール値は、最初の請求書照合のためにtrueに設定する必要がありますが、2回目の請求書による(非)照合では設定しないでください。
は、だから私は探していますどのような部分文字列が長い単語invoiced, invoice-process etc.
の一部ではないことを、文字列pdfText
でサブInvoice
を見つけて確認することです。 invoice.
はTrue
を返すはずです。
私はこれが可能であるべきだと思っていますが、私の頭の中でそれを現在包み込むことはできません。 regexを使う必要があるかもしれませんか?
代わりに正規表現のマッチングを符号化する、あなたはUiPath活動を使用する必要があります。 –
@NicolaiKrüger私はUiPathに全く慣れていないので、もしあなたがそれをお勧めするならば、それを書き留めておきます。 – Mederic