私はAndroid Music Projectで光音楽認識について作業しています。私はモバイルカメラで楽譜の写真を撮り、ノートと記号を認識しようとします。私は前処理後の方法論に非常に精通していますが、これらの作業は通常スキャナーの助けを借りて行われます。Androidでミュージカルシートイメージのライン検出
直観的には、私はハフ変換を最初に使って譜表(スタッフライン)を検出し、それらと水平軸との間の角度を計算し、角度だけ画像を回転させました。これは理論的にはうまくいくかもしれませんが、ハフルは線分を見つけ、これらの線分の角度は一貫していません。だから、それはうまくいきませんでした。(多分ので遠近効果の)その後
、私は多くのエッジ検出とライン見つけるアルゴリズムを試みたが、それらのどれも安定して働きました。今私は、Android上のドキュメントスキャナと同様の新たなアプローチを考えています
(周波数領域の回転と線分検出器を含みます)。イメージをスキャンしたドキュメントのような形式に変換しようとしています。自分のイメージを水平軸に揃えて、傾きと視点のために効果を取り除きたい。
誰もが、この「ドキュメントスキャン」を達成する方法についてのアイデアを持っているのだろうか。文書の整列や安定した線の検出についてご意見がありましたら、今後の作業に役立つはずです。ありがとうございました。
[このブログ](http://gaut.am/making-an-ocr-android-app-using-tesseract/)よく、またはあなたがしている場合は –
有用ではないかもしれませんJavaを使用する意思がある、オープンソースの光音楽認識エンジンであるhttp://audiveris.kenai.com/をチェックしてみるといいかもしれません(公開:私は簡単に貢献者でした、ずっと前です)。 – btown
@JasonRobinson:これはOCRプロジェクトには役立ちますが、これは私が信じるものではありませんが、とにかくありがとうございます。 –