2017-08-17 5 views
-4

私はウェブサイトからテキストを抽出するための小さなソフトウェアを作成しています。そこに利用可能な暗号化されたcaptchaがあります。私はそれを私のC#プログラムで解読し、それをバイパスしたい。ここに暗号化されたcaptchaがあり、そのページと対応するプレーンキャプチャにあります。暗号化されたキャプチャをプレーンテキストに戻す方法はありません

暗号化されたキャプチャ:

VFRZWVdLYlRpSUpXN1ZDdU1BcDZiK0lOWFdCTFNtM2cxZFRqb0dlR0txZnlmWHJ2U01OV0hFeW5FYm1YNUloR3JPdHhQaHBFT2tsbwpJbmlSbkxzNmdPblVGc1N0UmdnZDQxVUNHYlJseXFGRkE1d1o5ODNuSGc9PQ== 

出力プレーンテキストのキャプチャは次のとおりです。8RTE9

は、私は、この暗号化に使用するアルゴリズムを推測することが可能な方法はありますか?

+4

機械で簡単に読み込めるのであれば、なぜキャプチャを実装しますか? –

+0

私はその部分を理解しています。しかし私は私の仕事でこれをするように言われました。これを必要とする..任意のアイデアや提案をいただければ幸いです。 – mitesh

+2

簡単に解読できるのであれば、それはあまり良い "暗号化"ではありません。それがハッシュ値ならば、それはまったく解読できないかもしれません。 (どちらかと思われる)いずれにせよ、もしあなたが誰かのcaptchaの仕組みを知りたいのであれば、おそらく彼らに尋ねなければならないだろう。 – David

答えて

1

これに対する簡単な答えはできません。

とにかく使用したい方法を使用していません。

captchaが存在する理由は、マシンが自動ログインを実行しないようにするか、ユーザーが実際に人間であることを確認することです。

あなたはクライアント側でキャプチャを復号化することはできません。チャンスはcaptchaの処理がサーバー側で完全に行われることです。

暗号鍵は利用できず、宇宙の熱死後まで暗号鍵が通常のハードウェアを採用すると思われます。 Captchaが暗号化を使用する場合もそうです。代わりにハッシュを使用する可能性があります(可能性が高い)。

使用されている暗号化/ハッシュアルゴリズムを識別していますか?あなたがキャプチャライブラリが使用されているかどうかを調べることができるなら、デフォルト値を使用しているかどうかを調べ、それをマシンラーニング用のデータセットを作成するためのベースラインとして使用することができます。繰り返しますが、これらは大きなIFSとBUTSです。

オープンソースのキャプチャライブラリの場合、ライブラリを使用して機械学習アルゴリズムのトレーニングセットを生成することで、機械学習を使用してキャプチャを回避することができます。

もちろん、最終的にはあなたが仕事をしている会社の上司にこれをすることはできません。何年もの研究とおそらく何十万ドルか何百万ドルもの人々が、あなたがしなければならないことを人々が正確に行うことを妨げるこの種の技術を作り出しています。

関連する問題