0
私は見つけられたものすべてを使い果たしてしまいました。私はTwitterの投稿の行がある.txtを持っていて、テキストに記載されている@handle以外のすべてを削除しようとしています。例えばRegexのTwitterハンドル以外のすべてのテキストを選択しようとしています
:
行1:このテキストはHandle2 @とHandle3
@のために意味されることになる:
これは、ハンドル1行2 @つぶやきのテキストです
行1:@ Handle1
Row2:@ Handle2 @ Handle3
彼らはスペースなしですぐにそれらの後にコロンやピリオドを持っている場合でも、セット内のすべてのハンドルのために働く(しばしば起こる):私のようにハンドルを選択するために、正規表現の式を作ってみた
。
私はそれを否定先読みコマンドを追加してみました:(?!(@[^\W]*))
しかし、私は本当にそれを動作させるために追加するには、他に何を知りませんか?
ありがとうございます!
こんにちは、間違った結果を出すいくつかのつぶやきを追加してください。どのような結果が得られますか – smead
['s.gsub(/(@ \ w +)|(?:(?!@ \ w +) 。)*/m、 '\ 1').strip'](http://ideone.com/1P1j6G) –