私は以下の非常に単純化された訓練とテストの観察を持っていると言います。自然言語処理のための機械学習 - カスタム翻訳
トレーニング
input: her favourite dog was a huskey and her favourite cat was a leopard
output: dog=huskey, cat=leopard
input: her favourite dog was a beagle and her favourite cat was a lion
output: dog=beagle, cat=lion
input: her favourite dog was a poodle and her favourite cat was a burmese
output: dog=poodle, cat=burmese
テスト
input: her favourite dog was a collie and her favourite cat was a moggie
desired output: dog=collie, cat=moggie
- 所望の出力に変換テスト用入力を持つために私を可能にするためのpythonで最高の機械学習アプローチは何ですか?
- この未処理データをこの予測に使用する手順は何ですか?私は何をしようとしていますが、翻訳の形である一方、エリア内のいくつかの研究から、
(例えばhttp://scikit-learn.org/stable/)既存の機械学習パッケージの多くは、分類、回帰およびクラスタリングの周りにあるようです。
また、いくつかのNLPパッケージを調べましたが、その機能はキーワード識別、単語タイプの識別と感想分析(例:http://www.nltk.org/)にあります。そこにいくつかの翻訳パッケージが利用可能でもあるが、これらは、私は、この特定のケースの機械学習を徹底的に不要であるため、しかし、実際にははるかに複雑、異なる多数の入力があることを認識し、既存の言語(http://pythonhosted.org/goslate/)
ためのものです翻訳すること。