2017-04-02 1 views
-4

リストから文字列を受け取り、リストの各行のパターンに基づいて正規表現を生成するソフトウェアを作成するにはどうすればよいでしょうか。Regex + artificial intelligence

+0

リストやパターン/表現の例を挙げることはできますか? – CoronA

答えて

0

正規表現は正規表現であるため、よく定義されたパターンを一致させるために使用されます。一種のファジーマッチングが必要な場合、正規表現は必要ないか、有効ではありません。 「類似のテキストを見つける」アルゴリズムが必要な場合は、正規表現について忘れて、機械学習アルゴリズムの1つを使用してください。 Googleの機械学習アルゴリズム。

ところで、文字列のセットに一致する正規表現を生成するプログラムを作ることはあまり難しくありませんが、楽しい目的や学習目的のためだけに作られていれば、他に何が役立つか想像できませんために。

たとえば、「電子メールアドレスに似ています」という表現があれば、式を得ることができますが、厳密には電子メールアドレスかどうかは分かりません。現実の電子メールアドレスのサンプルから自動的に決定できないルールは、既存のすべての電子メールアカウントの実際の数よりも大幅に少なくなります。

私はそれを楽しくするために、長さのルールを最初に "抽出"します。最短よりも短くなく、最長より長くない。その後、キャラクタセットはセット内にのみ存在するか、完全な英数字に拡張されます。特殊文字には適用されません。それはおそらくいくつかの場合には機能し、他の人にとっては悲惨に失敗します。

関連する問題