Pythonにはかなり新しい(そしてStack Overflow!)ここに。件名データ(テキスト文字列)を持つデータセットがあり、これは単語モデルのバッグを作成するために取り組んでいます。さまざまなシナリオで0または1のフラグを立てる新しい変数を作成していますが、テキストに省略記号( "...")がある場所を特定しようとしています。 (「...」)を入力テキスト文字列Pythonで楕円を見つけるには?
Data_Frame['Elipses'] = Data_Frame.Subject_Line.str.match('(\w+)\.{2,}(.+)')
明白な理由のために動作しませんが、上記の正規表現のコードが示唆された - それでも動作しない:ここで私から始めているところです。これも試しました:
Data_Frame['Elipses'] = Data_Frame.Subject_Line.str.match('.\.\.\')
サイコロがありません。
上記のコードシェルは、私が作成した他の変数でも動作しますが、True/Falseではなく0-1の出力を作成する際に問題があります(Rのas.numeric引数になります)。ここで助けていただければ幸いです。
ありがとうございます!
:
あなたを与えるを)。あなたはSubject_Lineの例を挙げることができますか? –
エスケープ文字が間違っているようです。バックスラッシュはその前に来るべきです。 – davidmneedham
サンプルの件名は次のとおりです。 「、psst ...新しい_product名の時間」 –
foosgold