イメージをスキャンしてデータベースにアップロードします。私は文書を格納するためにmongodbを使用しています。ファイル内で検索する必要があります.OCRを使用すると可能です。だから私はクライアント側またはサーバー側でocrを使用する必要があります。私はMicrosoft Azureサーバーを使用しています。私は自分の歩みを考えました。OCR(光学式文字認識)は、Webアプリケーションでクライアント側またはサーバー側を使用する必要があります。
1)ファイルをスキャンする。
2)ファイルをmongodbにpdfファイルとして保存します。
2.1)スキャンした画像をOCRしてPDFとして保存し、OCRの結果とともにデータベースにアップロードします。
3)データベース内のキーワードを検索し、イメージIDを取得します。
4)ファイルをビューアでpdf形式で読み込みます。
私の目標を達成するには、最も簡単で簡単な方法を提案してください。
おかげでかなり良いですオープンソースたTesseract OCRに行くことができます。あなたは私に有用なリンクをくれてくれますか?より多くのことを明確にしてください。上記の戦略ポイントは良い方法ですか? dbでファイルをアップロードする前にocrする必要があることを意味します。 –
はい、このリンクのdb.checkにアップロードする前にocrを使用する必要があります。http://cloud.ocrsdk.com/Account/Welcome –
このリンクのすべてのプログラミング言語でサンプルコードを完成させてください。http://ocrsdk.com/documentation/code -samples /?アイコン –