2

私はcaffeでバイナリクラシファイアをトレーニングするために使用する巨大なデータセットをLMDB(40Gb)に用意しました。データ再生なしのprototxtでcaffeのラベルスムージング

Caffeのデータレイヤーには、整数ラベルが含まれています。

は、いくつかのランダムジッタを追加することで山車にそれらを変換する可能性の準備の層がありますので、私は技術を平滑にラベルを適用することができ、7.5.1 here

で説明したように、私はHDF5との例を見てきましたが、彼らが必要データセットを再生成して、私はそれを避けたいと思います。

答えて

1

DummyDataレイヤーを使用して、ラベルに追加するランダムノイズを生成することができます。ノイズが発生したら、Eltwiseレイヤーを使用して合計します。

layer { 
    name: "noise" 
    type: "DummyData" 
    top: "noise" 
    dummy_data_param { 
    shape { dim: 10 dim: 1 dim: 1 dim: 1 } # assuming batch size = 10 
    data_filler { type: "uniform" min: -0.1 max: 0.1 } # noise ~U(-0.1, 0.1) 
    } 
} 
layer { 
    name: "label_noise" 
    type: "Eltwise" 
    bottom: "label" # the input integer labels 
    bottom: "noise" 
    top: "label_noise" 
    eltwise_param { operation: SUM } 
} 
関連する問題