私は、PythonのPypandocモジュールを使用しています。私は変換に使用するコードである:docxからHTMLへの変換中にpandocが出力するHTMLを変更するには?
html = pypandoc.convert(
tmp_loc,
'html5',
extra_args=['--extract-media=']
)
このコードは、「HTML」に格納されていると同時に、DOCXから画像を抽出し、名前image01によってメディアリポジトリにそれらを記憶するHTMLにDOCXを変換します.jpg。 HTML内のimg srcがされています。今、私は何をしたいのか、より便利な名前にimage01.jpgで画像の名前を変更され
<img src="/media/image01.jpg" />
。私はリポジトリ内の画像の名前を簡単に変更できます。しかし、pypandocが出力するHTMLのimg srcタグをどのように更新すればよいですか?
は、私は、問題が実際にDOCXに接続されていると考えるあなたに
ありがとうございます。私は美しいスープを使ってHTMLを修正しました。出来た。 –
@ArunabhGhosh素晴らしい!受け入れ、答えをupvote自由に感じる:) – mb21