私はオンラインから得たつぶやきを削除するメソッドを持っていますが、コロンとアンダースコアを保持するように修正したいと思います。私はdocumentationをPythonでregexのために読んでいます。そしてre.subメソッドは最初にパターンを見つけて、それを "tweet"変数の空白で置き換えるようです。私はまだそれがパターンを指定する最初の部分を理解していない、私はいくつかの基本を理解しているような何かで始まるものを見つけることです、私は最後の部分を取ってみた(\w+:\/\/\S+)
完全にコロンが来ていたそれはまだコロンを削除しています。誰かがパターン発見部分の3つの部分がそれぞれ何をしているのか説明できますか?正規表現のPythonはコロンとアンダースコアを削除します
' '.join(re.sub("(@[A-Za-z0-9]+)|([^0-9A-Za-z \t])|(\w+:\/\/\S+)", " ", tweet).split())
ありがとうございます!私は2つの意味を持っていたか分からなかった –