私は
のような奇妙な文字はすべてがラインの下のどこかの時点で破損する原因となる当社のデータベースに表示されるデータとの一定の問題を抱えています。私は、Microsoft Officeから貼り付けることができるこれらの狂ったことのすべてを通し、特定の文字を通過させ、無視するシステムを用意する必要があります。このようなものが組み込まれているのですか、または最初から始めなければなりませんか?すべてタイプの文字を削除
答えて
まあ、このような文字をすべて削除することができます。 $text = preg_replace('@[^\d\w\s,.;:]@', '', $text);
ここで、[^\d\w\s,.;:]
は、保持する文字のセットです(\ d \ w \ sはすべての数字、文字、スペースを意味します)。あなたが保持したい他の文字でセットを修正してください。
しかし、それは間違ったアプローチです。代わりに、アプリケーション全体がUTF-8を一から使用して処理していることを確認して、それらの文字を正しく保存して処理できるようにする必要があります。この日および年齢ではASCIIまたはISOラテン語のサイトを作ることだけで奇妙で、基本的に起因する人々が実際に使用して文字を切り出すにデータ損失が発生する...
[OK]を、私は、文字エンコーディングには専門家ではないが、約言われましたこの特定の問題となぜそれを得る。上記の私のコメントで述べたように、すべての文字セットが一致していることを確認する必要があります。 [?]
「の文字のその特定の配列が あなたが見る[不明]の文字のための3バイトのUTF-8のコードは次のとおりです。あなたは、文字の特定のセットを取得する理由
しかし、ここにありますFirefoxで。あなたは、フォームでUTF-8のように1バイトのWindows-1252文字を表示し、 とき がデータベースに戻ってそれを提出することを取得します。ブラウザは、3バイトのUTF-8 文字を送信して場所」文字セットを理解
あなたはこの課題についてもっと読むことを強くお勧めします。ここでは良いスタートです:Character Sets/Character Encoding Issues
リンクの追加(および吸い上げ):http://www.joelonsoftware.com/articles/Unicode.html – cmbuckley
- 1. 「š»ż」または「」文字を取り除く方法
- 2. PHPページからを削除するには
- 3. テキストファイルからの読み込みの最初の文字:
- 4. >>�に変換
- 5. NUSOAPでエラーレスポンスが返されています。»¿ï»¿
- 6. 文字列からN番目の文字をすべて削除/削除
- 7. 私のウェブサイトで私のë、ï、öなどが違って見える
- 8. PDF-writerが無効なマルチバイト文字(US-ASCII)keyword_end content = "%PDF - #{@ version} \ n%â\Ï\ n" Rails 3
- 9. 文字列内の文字以外の文字をすべて削除する
- 10. 文字列と文字列をすべて文字列から削除する
- 11. javascript内のすべての文字列参照を削除、削除します
- 12. リスト内の各文字列の最後の2文字を除くすべての文字を削除する
- 13. 文字列のすべてを削除しますが、Rのスペース、ダッシュ、文字は削除しますか?
- 14. javascript文字列内の次のすべての文字を削除します。
- 15. すべての同じ文字を削除せずに1文字を削除する
- 16. mysqlの文字列の後のすべてを削除する
- 17. SQL Server - 文字列内のすべての文字を削除します。
- 18. Javascriptで文字列内のすべての文字を削除するには?
- 19. javascript文字列内のすべての文字を削除します
- 20. 特定の文字列以外の文字列をすべて削除する
- 21. ハスケルの文字列からすべての絵文字を削除します
- 22. 前最後の文字までのすべての文字を削除し
- 23. Golang - 文字列からすべてのUnicode改行文字を削除する
- 24. 文字、数字、アンダースコアを除くすべてを削除するには?
- 25. 文字列内のすべての大文字を削除できません。
- 26. すべての大文字を削除するC関数
- 27. HTML文字列からすべてのスペースを削除する
- 28. テキストファイルからすべてのASCII文字を削除する
- 29. URLからすべてのクエリ文字列を削除する
- 30. sqlで非数値の文字をすべて削除する
最も簡単な解決策は、プレーンテキストに貼り付け入力を強制的にフロントエンドにjsのハンドラを追加することであってもよいです。確かにどのように実装するかわからないが、私はいくつかのプロジェクトのFCK/CKエディタでオンになっているオプションがあることを知っている。クライアント側でこれを行うことで、ユーザーは書式がどのように見えるかを知ることができます。 – prodigitalson
あなたの問題のようなサウンドは、文字エンコーディングの競合です。すべての文字セット、データベース、データを追加するために使用されたWebページの文字セット、および受け入れられた応答と応答された文字セットのHTTPヘッダを確認しましたか? –