私はプログラマーではなく法律家ですが、現在は人工知能と著作権法に関するプロジェクトを研究しています。私は現在、アルゴリズムによって保護された作業が使用されている場合、機械学習アルゴリズムの学習プロセスが著作権侵害である可能性があるかどうかを検討しています。しかし、これは、アルゴリズムが作業をコピーするかどうかに依存します。機械学習アルゴリズムは、学習したデータをコピーしますか?
機械学習アルゴリズムは、分析しているデータ(画像/テキスト/動画/その他)を一般的にコピーしているか(短くても短くても)、あるいは他の方法でデータから必要な情報を取得できるかコピーを必要としない方法(人間がストップサインを見て、イメージを必ずコピーすることなくストップサインとして認識する方法)。
知識が不足していることを申し訳なく思っています。確立された機械学習知識に直面して私の説明が飛び交うのはごめんなさい。私が言ったように、私は単に低学歴の学生です。
ありがとうございます!
ありがとう:ここ
がCNNsからトレーニングデータを復元することは可能かもしれないことを示している2本の論文です。アルゴリズムがどのようにデータを取得するかという点で、定義されたデータセットが与えられている場合、これは著作権所有者からこの目的のためにライセンス供与されることができ、あまりにも多くのトリッキーな法的問題を引き起こさない。私が興味を持っているのは、アルゴリズムが許諾されていない保護された著作物を誤って使用し、これが著作権侵害であるかどうかです。 アルゴリズムは、定義されたトレーニングデータに基づいて動作しますか? –
「偶然に使用する」に展開しますか?それが訓練データとしてアルゴリズムに提示されるなら、それは偶然ではありません。トレーニングの後に使用中に見える場合は、ああ、それは難しいです。主流(全部ではない)のアプローチは、現在、トレーニング後に覚えたり覚えたりすることはありません(私は5~10年間で主流のアプローチにとどまることはできませんが)。 –
ここで私の主な質問は、マシン学習アルゴリズムが明示的にそれに与えられていないトレーニング中にデータを使用することは可能であろうかと思いますか? たとえば、プログラマーとして私のアルゴリズムを設定して、できるだけ多くのデータを取得するために停止標識の写真をインターネットでトラップすることは可能でしょうか? –