2017-03-14 4 views
1

CNTK Text Readerで特殊文字をエスケープする方法は? 「|」私のような特殊なcharachterをエスケープするにはどうすればよいCTF形式のファイルを読み込むこのような読者のために

 query   = StreamDef(field='S0', shape=vocab_size, is_sparse=True), 
    intent  = StreamDef(field='S1', shape=num_intents, is_sparse=True), 
    slot_labels = StreamDef(field='S2', shape=num_labels, is_sparse=True) 

それがトークンならば? トークン自体が "|"である行の警告が表示されます。

48155 | S0 196:1 |# - | S2 0:1 |#なし

48155 | S0 18217:1 |#| | S2 0:1 |#なし

48155 | S0 3152:1 |#シンディ| S2 0:1 |#なし

CFTファイルを作成するときに、私はこれらを削除することができますが、私はどのように私達ができると思いましてこれを対応して。また、あなたのコーパスに表示されていない別の単語や文字にパイプをマッピングすることができ|# this is a CTF comment with an escaped pipe: '|#'

答えて

0

パイプは、それにハッシュ記号を追加してエスケープすることができます。私は通常パイプをパイプで置き換えます。

0

: おかげ

関連する問題