ニューラルネットワークをテキスト関連に使用することは、非数値入力データに問題があるため、難しいことが分かります。 しかし、私は数学的なセットについてはわかりません。セットのセット。人工ニューラルネットワークは数学的なセットで動作できますか?
[0,1,2]および[3,4,5]または[[0,1]、[2,3]]および[[4,5]、[6,7]]と同様
対応するすべての要素間の距離を計算することによって、これらの距離を計算することは可能でしょうか?私はそれについての情報を本当に見つけることができず、確信が持たれていないニューラルネットワークを使い始めたくない。
(結果は用語「データセット」であるとして、すべてのあなたが得るためだけの「セット」を使って何をグーグルでは有望ではありません。)
EDIT:
まず:割り当ては、具体的を要求します私はk-meansや他のクラスタリング方法を使うことができません。
元の質問は実際の問題に実際には対応していませんでした。距離メトリックを考える必要はなく、アクティブ化関数にセットを追加する方法と、それらを単一の値にマップする方法について考える必要はありません。しかし、距離メトリックに関して、私はそれが必要なニューラルネットワークのどの点で実際には本当に確かではありません。私はそれが基本的な理解の問題だと思います。
私はちょうどいくつかの考えを書き留めます。
私を混乱させるものは、カテゴリの標準化です。 「赤」、「緑」、「青」の3つのカテゴリを持つと1から3の数字にマップできますが、「赤」は「緑」よりも「青」までの距離が大きくなります。場合。したがって、カテゴリは、(1,0,0)と(0,1,0)と(0,0,1)として符号化され、すべて同じ距離になります。
したがって、これらを何らかの形でアクティベーション機能に追加する必要があります。私はそれらが(1,0,0)= 100 = 4、(0,1,0)= 010 = 2、(0,0,1)= 001 = 1というように、2進数として解釈されると想像することができます。それははっきりとしたマッピングです。しかし、1から3までの数字は異なるので、上記のように、ある時点で距離メトリックが必要である必要があります。
したがって、問題はまだセットを単一の値にマップする方法です。私はそれを関数に追加する前にこれを行うことができます。そのため、距離のメトリックを適用する時点になると、セットに論理的な距離を維持できるマッピングを選択する必要はありません。マップされた値を使用する必要はありません。あれは正しいですか?または私はまだ何かを欠いている?
セット間の距離を計算することは*目標*ですか?これを行うにはいくつかの方法があります。その定義方法によっては、距離メトリックを定義した後は機械学習の必要はありません。ただそれを直接計算することができます。それが目標でないなら、何がありますか?ほとんどの場合、データをエンコードする方法はほとんどありません(また、聞いたこととは逆に、テキストデータもエンコードするのは簡単です)。しかし、問題の説明に依存します。 – Ray
まあ、クラスタリングは目標です。私の問題は実際に活性化関数だと思います。私は何とかセットを単純な値にマップして、計算に追加する必要があります。または、入力ベクトルの一部としてセットを処理できるアクティベーション関数がありますか? 入力ベクトルの形式を最初から変更する必要がありますか?(4,5.2、[1,0])が(4,5.2,1,0)になるように?そのようなセットをもっと重要なものにするのは正しいとは思われません。 これらの基本的な質問は申し訳ありませんが、私は全く新しいので、満足のいく答えは見つかりません。 – Jessus
ニューラルネットを使用するには、入力をベクトルにマッピングする方法を見つける必要があります。その特定のやり方が理想的かどうかは、{{1,0}}と{1,0}を区別することがどれほど重要かにかかっています。私は、質問を編集して、セットが表すものと、なぜそれがクラスタリングされているのかを詳細に説明することが役立つと思います。たぶんあなたが一緒に集まりたいと思うセットの種類のいくつかの例。 '{0,1,2}'は '{0,1}'や '{{0}、{1}、{2}}'にもっと似ていますか?私たちは情報の並べ替えを持ったら、私たちは、入力ベクトルへのマッピング(あなたがニューラルネットワークを使用することができます)、または正式な距離メトリックのいずれかを作成する方法(続き...) – Ray