私はOCRのスキャン機能付きのiPhoneアプリを開発しました。 Tesseract APIを使用して、撮影した画像からテキストを取得しました。 しかし、私は名前、住所、電子メール、電話番号などに関してそれぞれのテキストを分ける必要があります。 名刺の構造/形式は特定ではないので、想定するのは難しいです。名刺パーサ。どのように名刺から認識されたテキストから関連情報を抽出するのですか?
1) "@"文字列を含む文字列は主に電子メールIDになります。 2)すべての数字に中かっこまたは+記号が付いています。電話番号は になりますが、まだ多くの可能性があります。
g8Tesseractを使用して、画像からテキストを取得しました。しかし、どのようにして各テキストの名前、アドレス、および指定を分けることができますか? appcardで利用可能なcamcard、bizcamcard、またはanyother appのために彼らが従ったプロセスは?私は研究開発のためにたくさん試しましたが、役に立たないです。 –