2017-01-13 7 views
0

Tensorflowで作業しています。私たちは、言葉やブランドなどの非常に大きなデータセットを持っています。我々は単語のサフィックスを生成しようとしている。例えば、 'real'は 'realtor'、 'really'、 'realestate'を与える​​ことができます。データセットでは、各単語は\ nで区切られます。Tensorflowを使用して単語サフィックスを生成する方法は?

これまでいくつかのことを試みましたが、適切な結果が得られていないようです。これは解決すべき簡単な作業だと私には思われます。

私たちが取り組んでいる基本的な考えは、char-rnn-tensorflowのものです。キャリッジリターンがサンプリングされるまで、サンプリングをサンプル(重み付きランダム確率)に変更しました。 rnn_decoderとsequence_loss_by_exampleを元の実装に保ち、rnnをモデルとして使用しました。

これまでのところ、良いサンプル、ほとんど無作為のもの、時には接尾辞は得られませんでしたが、私たちの言葉の始まりとは関係ありません。この実装では単語を区切らないので、よりシンプルなものが必要になる可能性があります。

このようなタスクにはどのような技術を使用しますか?

答えて

0

最後に、ネットワークのパラメータを注意深く調整し、結果に温度を適用して良い結果を得ることができました。シーケンスの長さは、トレーニング中に非常に重要でした。

関連する問題