2017-05-23 6 views
-2

私は以下のようにテキストをフォーマットするHTMLページを持っています。私は、同じ書式でテキストファイルを生成したい。htmlページをテキストファイルに変換するにはどうすればいいですか?

Text1                 Text2 

    This is the paragraph1 

    Text 

    01.03.2017 
    This is the paragraph 2 

現在、私はhtml2textクラスを使用していますが、私が得た出力が異なっている、それは出力の下にこのことを示して

include("html2text/html2text.php"); 
    $text = convert_html_to_text($my_var); 

は、1つのラインで

Text1 Text2 This is paragraph 1 Text 01.03.2017 This is the paragraph2 

だから、すべてを生成します。しかし、私はHTML文書をレンダリングするのと同じ形式にしたい。これをどのように達成するのですか?

答えて

0

あなたのHTMLファイルにHTMLタグが含まれていないので、なぜそれをテキストに変換したいのですか?それはすでにテキストファイルです。

$ my_var変数の前後に "pre"タグを追加できます。おそらく、使用するライブラリはタグ内の空白を保持します。

これでうまくいかない場合は、最初にすべての二重スペースを別の文字列に置き換えることができます。変換を行い、再度文字列を二重スペースに置き換えます。

+0

いいえテキストファイルではありません.HTMLファイルです。ブラウザの出力をここに示しました。 –

+0

彼はこれを逆にしたいと思うと思うhttps://stackoverflow.com/questions/43996613/how-to-get-text-from-word-file-using-php-accurately。 HTMLからWordファイルを作成 – RST

+0

いいえ@ RST.thisこれはまったく別の問題です。あなたにはこれに対する解決策がありますか? –

0

これは基本的にスタイリングの問題です。

バックグラウンドについては、Cascading Style Sheets (CSS)をご覧ください。ブラウザはCSSコードを使用して、HTMLをユーザーに表示する方法を決定します。

これは、この問題は、スタイリングをサポートするドキュメント形式でのみ自動的に解決できることを意味します。 HTML + CSSを入力として受け取り、選択した形式を出力するコンバーターを探すかもし​​れません。たとえば、pandocを参照してください。

プレーンテキストの場合、この問題は自動的に解決できません。負のスペースまたは空白をタイプされたスペースに変換する必要がありますが、正確にどれくらいのスペースが必要かを判断するのは非常に難しいです。

関連する問題