-3

ニューラルネットワークをテキスト関連に使用することは、非数値入力データに問題があるため、難しいことが分かります。 しかし、私は数学的なセットについてはわかりません。セットのセット。人工ニューラルネットワークは数学的なセットで動作できますか?

[0,1,2]および[3,4,5]または[[0,1]、[2,3]]および[[4,5]、[6,7]]と同様

対応するすべての要素間の距離を計算することによって、これらの距離を計算することは可能でしょうか?私はそれについての情報を本当に見つけることができず、確信が持たれていないニューラルネットワークを使い始めたくない。

(結果は用語「データセット」であるとして、すべてのあなたが得るためだけの「セット」を使って何をグーグルでは有望ではありません。)

EDIT:

まず:割り当ては、具体的を要求します私はk-meansや他のクラスタリング方法を使うことができません。

元の質問は実際の問題に実際には対応していませんでした。距離メトリックを考える必要はなく、アクティブ化関数にセットを追加する方法と、それらを単一の値にマップする方法について考える必要はありません。しかし、距離メトリックに関して、私はそれが必要なニューラルネットワークのどの点で実際には本当に確かではありません。私はそれが基本的な理解の問題だと思います。

私はちょうどいくつかの考えを書き留めます。

私を混乱させるものは、カテゴリの標準化です。 「赤」、「緑」、「青」の3つのカテゴリを持つと1から3の数字にマップできますが、「赤」は「緑」よりも「青」までの距離が大きくなります。場合。したがって、カテゴリは、(1,0,0)と(0,1,0)と(0,0,1)として符号化され、すべて同じ距離になります。

したがって、これらを何らかの形でアクティベーション機能に追加する必要があります。私はそれらが(1,0,0)= 100 = 4、(0,1,0)= 010 = 2、(0,0,1)= 001 = 1というように、2進数として解釈されると想像することができます。それははっきりとしたマッピングです。しかし、1から3までの数字は異なるので、上記のように、ある時点で距離メトリックが必要である必要があります。

したがって、問題はまだセットを単一の値にマップする方法です。私はそれを関数に追加する前にこれを行うことができます。そのため、距離のメトリックを適用する時点になると、セットに論理的な距離を維持できるマッピングを選択する必要はありません。マップされた値を使用する必要はありません。あれは正しいですか?または私はまだ何かを欠いている?

+0

セット間の距離を計算することは*目標*ですか?これを行うにはいくつかの方法があります。その定義方法によっては、距離メトリックを定義した後は機械学習の必要はありません。ただそれを直接計算することができます。それが目標でないなら、何がありますか?ほとんどの場合、データをエンコードする方法はほとんどありません(また、聞いたこととは逆に、テキストデータもエンコードするのは簡単です)。しかし、問題の説明に依存します。 – Ray

+0

まあ、クラスタリングは目標です。私の問題は実際に活性化関数だと思います。私は何とかセットを単純な値にマップして、計算に追加する必要があります。または、入力ベクトルの一部としてセットを処理できるアクティベーション関数がありますか? 入力ベクトルの形式を最初から変更する必要がありますか?(4,5.2、[1,0])が(4,5.2,1,0)になるように?そのようなセットをもっと重要なものにするのは正しいとは思われません。 これらの基本的な質問は申し訳ありませんが、私は全く新しいので、満足のいく答えは見つかりません。 – Jessus

+0

ニューラルネットを使用するには、入力をベクトルにマッピングする方法を見つける必要があります。その特定のやり方が理想的かどうかは、{{1,0}}と{1,0}を区別することがどれほど重要かにかかっています。私は、質問を編集して、セットが表すものと、なぜそれがクラスタリングされているのかを詳細に説明することが役立つと思います。たぶんあなたが一緒に集まりたいと思うセットの種類のいくつかの例。 '{0,1,2}'は '{0,1}'や '{{0}、{1}、{2}}'にもっと似ていますか?私たちは情報の並べ替えを持ったら、私たちは、入力ベクトルへのマッピング(あなたがニューラルネットワークを使用することができます)、または正式な距離メトリックのいずれかを作成する方法(続き...) – Ray

答えて

0

一般に、ニューラルネットにはこのような問題はありません。画像認識と言語翻訳は、そのドメイン内にあります。あなたはを実行する必要があります。の必要性は、正確に順序付けられた方法で入力をグランド真理に関連付けるためのメトリクスと操作です。距離メトリックは非常にうまくいくでしょう。

あなたのニューラルネットワークを構築してください。適切な距離関数を与えて、それを離れて訓練させます。完全に緩くする前に、何回か繰り返して操作を追跡するために、いくつかの追跡計器(例:印刷ステートメント)を入れてください。

関連する問題