、CNTK Text Readerで特殊文字をエスケープする方法は? 「|」私のような特殊なcharachterをエスケープするにはどうすればよいCTF形式のファイルを読み込むこのような読者のために
query = StreamDef(field='S0', shape=vocab_size, is_sparse=True),
intent = StreamDef(field='S1', shape=num_intents, is_sparse=True),
slot_labels = StreamDef(field='S2', shape=num_labels, is_sparse=True)
それがトークンならば? トークン自体が "|"である行の警告が表示されます。
48155 | S0 196:1 |# - | S2 0:1 |#なし
48155 | S0 18217:1 |#| | S2 0:1 |#なし
48155 | S0 3152:1 |#シンディ| S2 0:1 |#なし
CFTファイルを作成するときに、私はこれらを削除することができますが、私はどのように私達ができると思いましてこれを対応して。また、あなたのコーパスに表示されていない別の単語や文字にパイプをマッピングすることができ|# this is a CTF comment with an escaped pipe: '|#'