2017-10-28 6 views
0

私は魔法使いから画像で構成された訓練セットを持っていますが、固定数の文字と数字で形成されたラベルを予測する必要があります。 これらのラベルをテンソルフローにフィードする最も良い方法は何ですか?私は数字のリストを作成することを考えました、ラベルのすべての文字/数字の1つ。 私はアラ可能な値のリストを作成しました:テンソルフローでラベルを送る最良の方法

__dict = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 
      'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9'] 

はその後、私は数字のリストにラベルをエンコードするために__dict変数に文字のインデックスを使用します。たとえば :

label = abc 
label_encoded = [0, 1, 2] 

はそれが正しい方法ですか?

答えて

1

最良の方法は、文字がある場合は、ベース36(との位置エンコーディングを使用することが便利であるすなわちAAA = 0、AAB = 1、など

、あなたのラベルごとに一意の整数を使用することです小文字の英字+数字)。

私はあなたが直面している問題を知っているが、これは私が作成しなければならない。このようにして、ラベルの膨大な数(あなたの分類問題のために、すなわち出力クラス)

+0

につながる可能性があるという事実に注意を払っていませんすべての可能なラベル。それは非常に高価なことができます。私が最初に思ったのと同じような方法がありますか?ありがとうございました。 – Yes92

+0

これは問題によって異なります。ラベル "aaa"と "bcd"が何も共有していない場合、それらは分類問題の異なるクラスとして扱われるべきです。はい、可能なすべてのラベルを作成する必要があります。すべては、あなたが達成したいものに主に依存します。 –

関連する問題