2

SparseTensorのラベルが実際のラベルの長さを超える必要がある値を理解するのは混乱します。それだけでNOですがスパースでTensorFlow - CTC損失層ごとのブランクラベルのインデックス

# 'H','E','L','L','O' 
targ1=[7,4,11,11,14] 

# 'N','O' 
targ2=[13,14] 

sparse = [ [7,4,11,11,14], 
      [13,14,0,0,0] ] 

、第二のバッチの実際の転写産物はNOAAAとして表示されます。だから、たとえば、のは、私は、インデックス0から26で-Zにラベルを付けていると、ターゲットのラベルがあるとしましょうですから、私はTensorFlowがこれを処理しながら損失をどのように処理するのか知りたいと思います。これは、ネットワークが不正な文字列を出力することを学ばせないでしょうか?または、ラベルのインデックスを0から26ではなく1から27の範囲にすることができます。そのため、ネットワークでは1-27の間のクラスのみを出力するよう強制されますが、これでも完全に機能するとは確信できません。 CTC Loss opを:

また、私は、私はここに見つけた、CTCの損失が空白のラベルの指数については言及していないためTensorFlowマニュアルがN_Classes - 1を想定していると思います。誰かがそのような仮定が正しいかどうかを確認できますか?

私は疑問を明確にしてください。あなたの時間とサポートに感謝します。

答えて

1

CTC_OPS源は、inputsテンソルの最も内側の寸法サイズ

を主張num_classes、num_labelsが真のラベルの数であり、そして 最大値(num_classes - 1)が空白ラベルのために予約され num_labels + 1クラスを表し

0

I最近研究音声認識は、tensorflowでSparseTensorは0no-classを意味ので、それは、ラベル行列で0を追加することを意味しますので、私はblank-labelクラスのインデックスは0だと思う、とnum_classesは1-27です。

関連する問題