2017-05-20 13 views
1

複数のhtmlファイルの中のテキストを検索し、以下のコードに置き換えようとしています.HTMLを.txtに変換したものではなく、.txtで動作します。 それはutf-16の問題ですか?どのように私はそれを動作させることができますか?htmlファイル内のテキストをpythonで検索/置換する

import os 
directory ="/Users/sinanatra/PYTHON_STUFF/MSN/0/" 

replacement = "test" 
for dname, dirs, files in os.walk(directory): 
    for fname in files: 
     fpath = os.path.join(dname, fname) 
     with open(fpath) as f: 
      s = f.read() 
     s = s.replace("head", replacement) 
     with open(fpath, "w") as f: 
      f.write(s)     

答えて

1

あなたはUTF-16を使用する場合、あなたは

s.read().decode('utf-16')を必要とし、書き込みのためにあなたが必要となります。

f.write(s.encode('utf16'))

+0

それはで動作します - > f.write(s.encode( 'utf16')) –

+0

はい、私は書き込み事を忘れていました –

関連する問題