sgml

    0

    1答えて

    私はPerlを使ってDTDからすべてのコンテンツを抜き出すことを検討していますが、どの方法が最善の方法かはわかりません。私はXMLを扱うためのモジュールがあることは知っていますが、SGMLを使ったこのタイプの作業があるかどうか、またはこの作業のための正規表現を作成する必要があるかどうかはわかりません。 私は非常に単純なパターンマッチングを除いて、正規表現の経験があまりないと同時にSGMLとPerl

    6

    3答えて

    私のHTMLレンダラーをよりよく適合させるためにこの定義を探しています。現在、どの空白を保持するか、どの空白を残すか、そして何を投げるかを推測しています。 SGML標準は見つけにくいですし、HTML標準では、私のニーズに必要な深さで対象を扱うようには見えません。 現在、私のレンダラはHTMLをツリーに解析し、すべての要素とその内容を配置するための再帰的なレイアウトを行います。私は、解析段階でいくつ

    1

    3答えて

    私はSGMLファイルを読み込み、それを解析してXMLに変換しようとするPerl初心者です。そのため、すべての要素のキーと値のペアを取得できます。私はSGML::DTDParseとXML::Simpleのモジュールを見つけました。私はこれが私の仕事のために望んでいると思います。私の問題は、私はDTDParseまたは任意のコード例に関するドキュメントを見つけることができないということです。 私のコード

    2

    1答えて

    私はPython 2.7.1でBeautiful Soup 3.2を使用しています。 私は最近、仕事に簡単な何かを取得しようとしてきたが、それ はかなりトリッキーなようだ: 私は次のようにします。 temp=BeautifulSoup(urllib2.urlopen(urlList[1], None,15)) しかし、私はエラーを取得する: File "/home/foo/k/kat/Beau

    6

    3答えて

    私が理解しているように、XMLはSGMLのサブセットであり、SGMLを簡素化し、より広く使用することを奨励しています。 ほとんどの便利な機能はXMLにもたらされたと思いますが、XMLの代わりにそれを使用する動機づけに十分な強力な機能がSGMLにあります(複雑さのオーバーヘッドを受け入れます)。

    2

    1答えて

    データベースから非標準文字が抜けています(改行のため)。 私のHTMLバリデーターは、それらについて不平を言っています。 私のHTMLバリデーターは私の自我の直接の拡張であるので、私は物事を幸せに保ちたいと思います。ok-arrow-y。 これまでにやったことがある人はすぐに修正できますか? 私はページの文字セット、doctype、またはデータを変更したくありません。単なる文字列をクリーンアップす

    2

    1答えて

    空白、引用符、等号、およびタブとは別に、ASCIIの印刷可能なサブセットの他の文字はSGMLの属性名として使用できませんか?

    1

    2答えて

    ISO definition of generalized markup状態: プログラムやデータベースなどの厳密に定義されたオブジェクトを処理するために利用可能な技術が同様に処理文書に使用することができるようにマークアップは厳格でなければなりません。 この文脈で「厳密」とは何を意味しますか? 私が言うどのa paperが見つかりました:機械加工が必要であることを厳密に記述された文書を構成する[.

    5

    1答えて

    Emacsは常にsgmlタグ(C-c-C-t)を閉じることができますか? たとえば、div,タグは正常に動作しますが、pまたはliは無効です。 基本的に私は、タグを挿入するときに私が常にxhtmlを使用していることを特定する方法を探しています。あなたがsgml-xml-modeをオンにする必要があり

    0

    1答えて

    私は、カスタムのOFX - > XMLパーサをC#で作成しています。 現在、標準のXMLTextReaderを使用しています。 OFX形式は、以下の構造を持っている場合があります事は要素がテキストなら、前の1が終了タグを持っていないです <STATUS> <CODE>0 <SEVERITY>INFO </STATUS> を。私はそれを追加したい。しかし、私は持っている: