softmax

    0

    1答えて

    私はテンソルフローのMNISTチュートリアルの変更に取り組んでいます。私は36のクラスを持っています。 マイNN出力:ソフトマックスを使用した後 [[ -2386.17529297 18497.5546875 12824.89257812 11382.53417969 5093.64941406 13072.60546875 -4560.9921875 13502.52148438 6688.22

    0

    1答えて

    私は、-max _i x_i要素に足してsoftmaxを安定させる方法を知っています。これにより、オーバーフローやアンダーフローが回避されます。 これを記録すると、アンダーフローが発生する可能性があります。 log softmax(x)はゼロに評価され、無限大に至る。 私はそれを修正する方法がわかりません。私はこれが共通の問題であることを知っています。私はそれについていくつかの答えを読んだが、私は

    0

    1答えて

    標準のSVHNクロッピング数字データセットを使用して、テストセットで89.89%の精度で10桁の数字に分類されるモデルを生成しました。私は画像上の複数の数字を検出したいと思います。 (例えば、自動車登録プレート上の数字)これをどうやって行うのですか?複数の画像を検出するためにモデルを再学習する必要がありますか? #conv1 W_conv1 = weight_variable([5, 5, 1,

    1

    1答えて

    私は、自動品質管理の目的で画像を分類するようにCNNを設計しました。入力イメージは320 x 320ピクセルです。私は5 convレイヤー、512出力のFCレイヤー、2つの出力のみを持つ最終レイヤーを持っています:「良い」か「悪い」。品質管理は1.0精度で行わなければならない。私はテンソルフローを使用しています。 私はCNN初心者で、私のモデルの評価に問題があります。トレーニングセットでは1.0の

    1

    2答えて

    私は、年齢分類のためのalexnetに基づくネットワークを持っています。 私は8つのクラスのためのネットワークを訓練するとき、それは完全にうまく動作しますが、60または100にクラスを増やすと、 "損失モデル= NaNで分岐する" 私はすでに学習率を0.00000001または0.0に減らし、 。しかし助けなかった。 私の損失関数は次のとおりです。 def loss(logits, labels):

    17

    1答えて

    私は、大きな語彙を扱うことができる階層的なsoftmaxモデル、例えば10Mクラスのオーダーを実装することに興味があります。大規模なクラスにスケーラビリティがあり、効率的になるようにするには、これを行う最善の方法は何ですか?例えば、少なくともone paperは、各ノードがクラスする2レベルのツリーを使用する場合、HSが大きなボキャブのスピードアップを〜25倍に達成できることを示しています。sqr

    2

    1答えて

    私は蒸留の概念を適用しようとしていますが、基本的に新しい小さなネットワークを訓練して元のものと同じようにするが、計算は少なくて済みます。 私はロジットの代わりにすべてのサンプルに対してsoftmax出力を持っています。 私の質問は、カテゴリクロスエントロピー損失関数はどのように実装されていますか?これと同様 元のラベルの最大値をとり、同じインデックスに対応付け予測値とを乗算し、またはそれは、すべて

    -1

    1答えて

    私は、分類タスクの最後の層としてsoftmax層を持つニューラルネットワークを持っているとします。ソフトマックス層のニューロン数は、クラス数になります。 しかし、新しいデータが入ったときにクラスの数を増やすと、ネットワークアーキテクチャを変更して、モデル全体を最初から再学習する必要があります。 スケーラブルな分類子を作成するための最良の方法は何でしょうか? PS:ニューラルネットワークモデルは、2

    0

    1答えて

    として緻密層は https://pdfs.semanticscholar.org/3b57/85ca3c29c963ae396c2f94ba1a805c787cc8.pdf に説明し、私は最後の層で立ち往生しています。私はこのようなcnnをモデル化しました # Model function for CNN def cnn_model_fn(features, labels, mode):

    0

    1答えて

    私はその値が同様であることをTensorflowにおけるテンソルがあるとします。他では B = [[1, 0, 0],[0, 0, 1]] :私は次のように、このテンソルを変更するにはどうすればよい A = [[0.7, 0.2, 0.1],[0.1, 0.4, 0.5]] を言葉を最大限にして1に置き換えたい。 助けてください。