TensorFlowモデル(ここではエキスパートと表記されています)のリストを受け取り、次の図に示すようにMixture of Expertsからビルドした汎用モジュールを実装したいと思いますhttp://www.aclweb.org/anthology/C16-1133TensorFlowでのエキスパートの混合
したがって、このモデルは、異なる専門家に同様にゲーティングネットワークに供給される入力x
を取得します。最終的な出力はensemble output
に対応し、これは、異なるエキスパートからの出力の合計に、対応するゲーティング関数gm
(ゲーティングネットワークに由来)を掛けたもので与えられます。すべての専門家ネットワークは、同時に訓練されています。
このモジュールはバッチトレーニングに適していることが重要です。私はすでに実装されているものを探していましたが、これはTensorFlowではなく、https://github.com/AmazaspShumik/Mixture-Modelsでした。
今、私は、このモジュールを構築するための最良のアプローチ、つまりすでに実装されているTFレイヤーやラッパーについて、このアプリケーションに適したポインタや提案を探しています。