0
モデルのフォワードパスに必要なフロップ数を取得するためにtfprofを使用しています。 私のモデルは3層のLSTMであり、その後は完全に接続されたレイヤーです。 完全に接続されたレイヤーでは線形に計算数が増えますが、LSTMレイヤーでは変化しません。それはどのように可能なのでしょうか?Tensorflow tfprof LSTMCell
tfprof 1タイムスタンプフォワードパスのレポート。
==================Model Analysis Report======================
_TFProfRoot (0/2.71m flops)
rnn/while/multi_rnn_cell/cell_1/lstm_cell/lstm_cell_1/MatMul (1.05m/1.05m flops)
rnn/while/multi_rnn_cell/cell_2/lstm_cell/lstm_cell_1/MatMul (1.05m/1.05m flops)
rnn/while/multi_rnn_cell/cell_0/lstm_cell/lstm_cell_1/MatMul (606.21k/606.21k flops)
fc_layer/MatMul (1.54k/1.54k flops)
rnn/while/multi_rnn_cell/cell_0/lstm_cell/lstm_cell_1/BiasAdd (1.02k/1.02k flops)
rnn/while/multi_rnn_cell/cell_1/lstm_cell/lstm_cell_1/BiasAdd (1.02k/1.02k flops)
rnn/while/multi_rnn_cell/cell_2/lstm_cell/lstm_cell_1/BiasAdd (1.02k/1.02k flops)
fc_layer/BiasAdd (3/3 flops)
tfprof 2タイムスタンプのフォワードパスのレポート。
==================Model Analysis Report======================
_TFProfRoot (0/2.71m flops)
rnn/while/multi_rnn_cell/cell_1/lstm_cell/lstm_cell_1/MatMul (1.05m/1.05m flops)
rnn/while/multi_rnn_cell/cell_2/lstm_cell/lstm_cell_1/MatMul (1.05m/1.05m flops)
rnn/while/multi_rnn_cell/cell_0/lstm_cell/lstm_cell_1/MatMul (606.21k/606.21k flops)
fc_layer/MatMul (3.07k/3.07k flops)
rnn/while/multi_rnn_cell/cell_0/lstm_cell/lstm_cell_1/BiasAdd (1.02k/1.02k flops)
rnn/while/multi_rnn_cell/cell_1/lstm_cell/lstm_cell_1/BiasAdd (1.02k/1.02k flops)
rnn/while/multi_rnn_cell/cell_2/lstm_cell/lstm_cell_1/BiasAdd (1.02k/1.02k flops)
fc_layer/BiasAdd (6/6 flops)
明白な説明のためにありがとう。私は実際にdynamic_rnnを使用しています。 –