2013-04-27 13 views
13

私は、既存のHTMLスニペットを取り込み、マークダウンに変換したいと考えています。この目的のために 私が試したpandoc:Markdown以外のHTMLタグを保持しながらHTMLをMarkdownに変換するにはどうすればよいですか?

Hello 

<!-- more --> 

and some more text 

<h2>some heading</h2>  

結果だったこの:

Hello and some more text 

some heading 
------------ 

このように、それだけではない改宗

pandoc test.html -o test.md 

はtest.htmlという、このように見えましたマークダウンで直接的な意味を持つタグ。また、HTMLとして保持したいタグ(HTMLコメント、iframeタグなど)も削除します。

  • マークダウンに相当するタグが生のHTMLとして保持されるようにHTMLをマークダウンに変換するにはどうすればよいですか?
  • さらに一般的に、HTMLからマークダウンへの変換がどのように行われるかを制御できますか?

特に、私はコマンドラインプログラムのオプションに興味があります。たとえば、おそらくpandocに提供できるオプションがあります。

+2

興味深いことに、私はまったく逆の問題があります。私がそれを求めていない間にdivを保持する – Sebas

答えて

17

もう少し検索した後、thread on table parsing--parse-rawオプションについて読んでいます。

--parse-rawオプションを追加すると、非マークダウン対応のHTMLタグが削除されないようです。

pandoc test.html -o test.md --parse-raw 
関連する問題