私には必要のないhtml属性があるニュースがあるテキストがあります。どのように私は、このような正規表現をテキストから削除する
IMG幅= "750" altが= "4.jg" C = "/アンロード/ medialiy/DF6/4.jg" 高さ= "499" タイトル=としてルビーでフレーズを削除することができます4.jg "
IMG幅= "770" ALT = "5.jg" C = "/アンロード/ medialiy/ty6/5.jg" 高さ= "499" タイトル= 5.jg"
だから、news.sub('/img*jg"/, '')
のような正規表現が必要です。それは動作しません。あなたがこれを行うことができ、あなたの特定のケースで
_ "私はHTML属性を持ってニュースをテキスト" _ - それは何を意味するのでしょうか? HTMLまたはHTMLを含むテキストがありますか?山括弧が欠けているのはなぜですか?あなたの実際の入力はどのように見えますか(つまり 'news')とあなたの期待される出力は何ですか? – Stefan