2016-08-31 7 views

答えて

4

あなたがカスタマイズする必要があります。あなたはベクトライザーをインスタンスtoken_patternパラメータは、例えば:

vent = CountVectorizer(token_pattern=r"(?u)\b\w\w+\b|!|\?|\"|\'") 
+0

あなたは、高速応答を@elyaseありがとう脱出を| | \ | \ "| \」の仕事をしてくれました。!?。私はパラメータ '(?u)\ b \ w \ w + \ b |!\ \ | \ "| \' 'を試しましたが、 "とにかくお返事ありがとう... –

+0

喜んでお待ちしています!生の文字列(r'string ')については、第2段落[ここ](https://docs.python.org/3.5/library/re)をご覧ください。 .html)。 – elyase

関連する問題