私は2つのネットワークを持っていると仮定します。最初のネットワークは2 Mのパラメータを持ち、2番目のネットワークは0.4 Mのパラメータを持っています。 1つのイメージ入力に対して、2番目のネットワーク(deploy.prototxtを使用)のテスト時間が最初のネットワークよりも速いと言うことができますか?メトリック(#depth、#parameter ....)は推論時間にどのような影響を及ぼしますか?推論時間はパラメータの数に依存しますか?
答えて
もちろん、より大きなネットワーク(複雑なネットワーク)では、最後のレイヤ(出力)に到達するために入力をすべてのネットワークに伝播する必要があるため、入力を評価するのに時間がかかります。したがって、それはパラメータの数に比例する、すなわち、深度、1つの層当たりのニューロンの数および各2つの層の間の連結のタイプに相関することは通常である。
必ずしもそのことを伝えることはできません。 0.4Mのパラメータネットワークはほとんどが畳み込みレイヤで構成され、2Mのパラメータネットワークは完全に接続されたレイヤで構成されているとします。その後、第1のものはより長い順路を取る。だから、それは深さ、パラメータ、操作の数などを含む多くのものに依存します。一般に、それは乗算の数に依存すると言うことができます。
パラメータの数はネットのテスト時間に影響しますが、それだけではありません。また、学習されたフィルタ/重みが適用されるデータ/機能のサイズも考慮する必要があります。例えば
、2つの簡単なCONV-ネットを考慮してください。
- ネットA
は、単一の7×7フィルタ
を持っている - ネットB
は、単一の3x3フィルタ
を持っていることは、ネットB
がありながらネットA
は49個のパラメータを持っていることは明らかです唯一の9.
しかし、ネットA
への入力は150x150イメージであり、ネットB
への入力は1500x1500イメージです。
明らかに、これらの設定では、ネットB
は入力の処理に時間がかかります。
多くの場合、ディープネットは完全に接続されたレイヤーとコンバージョンレイヤーを混在させるため、「同じサイズの入力」のフロップ数を比較することが困難/不可能になります。
ところで、それはまだ開いている問題は、compute the number of FLOPS required for a netに機能を追加するカフェです。
ありがとうございますが、公正な比較のために、同じ入力ディメンションを考慮する必要があります。ここでのパラメータは学習可能なパラメータのみです – KimHee
常に「公正」な比較を行うことはできません。例えば、ResNetsは通常、比較的少ないパラメータしか持たないが、非常に深く、入力/フィーチャサイズが非常に大きい。他方、VGGネットは、TONSのパラメータを有するが、入力/フィーチャのサイズが比較的小さい、十分に繋がった大きな層を有する。したがって、パラメータの数だけからFLOPSを決めることはできません。 – Shai
OK、https://arxiv.org/abs/1608.06993に関する1件の論文を見つけました。図3において、このスキームはより少ないパラメータを示す。どちらが速いのでしょうか? – KimHee
- 1. 揮発性(時間依存)変数は存在しますか?
- 2. タイプ推論の成功は値の名前付けに依存します
- 3. オプティマイザは、コンパイル時定数に基づいて数式を推論しますか?
- 4. スカラーのパラメータ型推論
- 5. 1つの型パラメータを推論しますが、他の型パラメータは推測しませんか?
- 6. Android:OS時間に依存しない一定の時間からのカウント日数
- 7. C時間機能はシステムクロックに依存しますか?
- 8. 何かは時間ベースに依存します
- 9. インストール時にPython推移依存性の問題を検出しますか?
- 10. 営業時間 - DIVは曜日と時間に依存します
- 11. 動的関数パラメータを使用したC#コンパイラ型の推論
- 12. 時間依存のkmlアニメーション
- 13. クライアントPCの時間に依存しないJavaScript時間
- 14. ジェネリックメソッドの配列パラメータのJava型推論
- 15. アンサンブルモデルの推論時間を改善する方法
- 16. NoSuchMethodExceptionは実行時間に依存します
- 17. 時間に依存し、所属する多数
- 18. C++テンプレート非型パラメータの型推論
- 19. インスタンスメソッドフォームの拡張のオーバーライドは、 '@objc'の廃止された推論に依存します
- 20. テスト時間依存サービスメソッド
- 21. JMSトピック時間依存
- 22. SVMトレーニングの時間は入力データの内容に依存しますか?
- 23. ボタンの時間と日付に依存
- 24. ディレクティブのリンク関数のパラメータはDIに依存していますか?で
- 25. LIBELASはカメラのパラメータに依存しますか?
- 26. すべての型パラメータは関数の依存関係によってお互いに依存します
- 27. 型推論は
- 28. タイプ推論 - Monadを推論できませんでした
- 29. 推論型はFragment!しかしPlaceAutocompleteFragmentは
- 30. 使用時間依存(熱)ソースは
パラメータは学習可能なパラメータを意味します。たとえば、resnetとvggのネットワーク – KimHee
@キム私は学習可能なパラメータも意味しています。あなたの言いたいことは何ですか? – lnman
はい、論文arxiv.org/abs/1608.06993の図3では、このスキームはより少ないパラメータを示しています。どちらが速いのでしょうか? – KimHee