2017-03-18 11 views
0

私はIBM Watson言語変換のトレーニング・データとして使用する記事を翻訳しています。これらの記事をトレーニングに使用する正しい方法は何ですか?記事全体とその翻訳をパラレルコーパスのエントリとして使用しているのですか?記事を複数の文に分割し、その翻訳ペアをエントリとして持つ必要がありますか?IBM Watson言語翻訳 - 並列コーパスを使用して訓練する正しい方法

答えて

1

2つの選択肢があります。

各フレーズのfromとtoを含むフレーズペアにテキストを分割し、forced_glossaryまたはparallel_corpusのいずれかを作成します。

または、すべての翻訳されたテキストを1つのファイルとして送信してmonolingual_corpusを作成します。

詳細なドキュメントはhttps://www.ibm.com/watson/developercloud/doc/language-translator/customizing.html#training で利用可能であり、APIドキュメントは、https://www.ibm.com/watson/developercloud/language-translator/api/v2/?curl#create-model

でご利用いただけます
関連する問題