2016-08-24 13 views
2

私の目標は、金融ドメイン、言語ペアCHT - ENとCHS - ENのカスタム翻訳エンジンを作成することです。私はそれぞれの辞書と整列したセグメントを用意してカスタムエンジンにインポートし、エンジンを訓練します。IBM Watson Machine Translation APIを使用してカスタム・ドメインを作成できますか?

ドキュメント(https://www.ibm.com/watson/developercloud/doc/language-translation/)が正しく理解されていれば、既存のドメインと言語のペアの上に構築することしかできません。だから、中国語 - 英語では、私は特許ドメインを選択して自分の辞書やコーパスをインポートしてから再トレーニングするしかありませんでした。これが意味をなさないのであれば、繁体字中国語や簡体字中国語を話しているかどうかは不明です。伝統的な中国語のサービスが最初に必要で、後で簡体字の中国語が必要です。

金融ニュースドメインの上に構築することもできますが、中国語 - 英語のニュースは利用できません。

私は最善の方法を見つけようとしています。どのように進んでいくのか、どのような指針に感謝しますか。

ありがとうございます!

+0

サービスが既存のドメイン/言語のペアのカスタマイズのみをサポートしているという点で、ドキュメントの読解は正しいと思います。私は伝統的な対中国の簡単な質問を探しています。 –

+0

更新:このサービスは、 "unihan"を使用して繁体字と簡体字中国語の両方をサポートしています。それがどのように出力されるかはわかりませんが、少なくとも両方のバリエーションをソース言語として入力できます。 –

答えて

0

モデルを作成するには、頻度の高いまたは信頼性の高いフレーズ訳またはパラレルコーパス(TMXファイル)を使用する用語集を使用します。

@ Nathanは、zh-en-patentbase_model_idと指定すると、unihanを使用して繁体字と簡体字の両方のサポートを提供します。 zh-en-patent今日中国語から英語への翻訳に使用できる唯一のモデルです。

ここでは、IBM Watson Language Translator serviceを使用してカスタム翻訳モデルを作成する方法について説明します。

関連する問題