私は盗作のアルゴリズムの比較をしようとしています。私は盗作に対するTEXTの比較をたくさん見つけました。C++変数と関数を難読化する方法
しかし、アルゴリズムは非常に異なります。膨大な数の変数、関数、ユーザー定義の構造を使用するアルゴリズムもあります。誰かがソースコードをコピーしている人は、変数と関数の名前を少なくとも変更します。単純なテキスト比較アルゴリズムでは、この関数と変数の違いは "違い"として数えられ、アルゴリズムは偽りに対して "false"を与えます。
私がしたいことは、C++ソースコード内のすべての変数、関数、およびユーザー定義の構造名を「一般化」することです(わかりません)。したがって、変数は、 "a"、 "b"、 "... fa(...)"、 "... fb(...)"のように命名されます。 PHPの文字列変数にC++のソースアルゴリズムを比較しています。
私は正確なソースコード比較のために他の多くのことを分析する必要があることを知っていますが、これで十分です。
私も改行でいくつかの余分な重要性を与えたいです、 ";"の後の改行、および中括弧の位置です。単純な初期例のように、いくつかの種類のアルゴリズムを「異なる方法」で作成するのはかなり難しいことがわかります。「2つの値の合計」です。 しかし、すべてのテキストの比較も問題です。 Webホストで実行されているため、コードをコンパイルできません。 – IPValverde