私は(他の多くの人のように)ユーザー入力を受け取り、データベースに格納し、後で(とりわけ)XMLツールを使用して処理します。アプリケーションは自由なテキスト入力を受け取り、他の多くの開発者と同様に、エスケープや引用には非常に注意していますので、空白、引用文字、予約されたXML文字などを含む入力を処理できます。縦のタブ文字(16進数0B)または改行(16進数0C)を含む文字列を入力します。これはXMLツールでは一切処理できず、アプリケーションはbarfになります。垂直タブやその他の無効なxml文字を処理するためのベストプラクティス
私のアプリケーションでは、「往復」プロセス中に元の入力を保持することが非常に重要です。私は好きではない文字を取り除くだけでなく、特に時折使用されるフォームフィードプレーンテキストファイルで。
XML処理が関係しているときにこれらの文字を処理するためのベストプラクティスまたは一般的な戦略はありますか?
-1:これは意味をなさない。無効なXMLは単純にXMLではありません。 –
それから質問は意味をなさない。 XMLに特殊な無効文字を入れる必要がある場合(無効な場合)、エスケープ処理はファイルの処理を許可し、無効な文字を使用する場合はアプリケーション自体で処理する必要があります。 CDATAやその他の形式も使用できます。 – Vincent
確かに、質問は意味をなさない。開発者がデータを送信する人々がXMLを理解できないという事実を補うように要求されている別のケースです。 –