2017-11-27 20 views
1

ここではPythonを初めて使い、正規表現のハングアップを試みています。Python:文字列の中のバックスラッシュを削除する

文字列の中からバックスラッシュを削除しようとしています。これは、Redditからコメントを引き出し、それらを整理し、それらを1つの長い文字列にする(または、少なくともそれが私の目的です)関数の一部です。関数を実行すると、元のテキストにアポストロフィがある場合は、追加の円記号が付いたテキストが表示されます。 "それは数年経ちました"

私はこのトピックに関する他の投稿があることを知っています。私はその結果の推奨事項、.replace( "\"、 "")および.replace( "\\ "、" ")。運がない。また、.decodeの問題もありません。

私は明らかに何かが不足しています。何か案は?

PS - 関連はありませんが、新しい行にそれぞれがあるのではなく、.replaceのものと同じ方法で.sub節をまとめることは可能ですか?

ありがとうございます!

list_reddit = [] 
subreddit = reddit.subreddit('politics') 
hot_python = subreddit.hot() 
hot_python = subreddit.hot(limit=1) 
for submission in hot_python: 
    comments = submission.comments 
    for comment in comments: 
     reddit_text = comment.body 
     nospaces = reddit_text.replace('\n',' ').replace('&#039', ' ') 
     formatone = re.sub(r"http\S+", ' ', nospaces) 
     formattwo = re.sub(r"https\S+", ' ', formatone) 
     list_reddit.append(formattwo) 
     onestring = ' '.join(list_reddit) 
+1

「string.replace( '\\'、 '')」 –

+0

ああ、申し訳ありませんが、私は誤って元の投稿にバックスラッシュの代わりにスラッシュを入れました。私はオリジナルを編集しました。しかし、関係なく、あなたのコメントはstring.replaceと[randomname] .replaceを使用すると違いが生じることを意味しますか? –

+0

私は文字列が変数であることを意味しました –

答えて

0

あなたは、単純な引用符で置き換える使用する必要があります。

string.replace('\\','') 

幸運を!

+2

ありがとう!私が掲示する前にそれを試みたにもかかわらず、私は今それを働かせただけです..私はあなたに信用します。 –

関連する問題