non-ascii-characters

    0

    1答えて

    名前と数値を含むフォームにListViewがあり、MSWord文書に文書の表に埋め込まれたデータを印刷する必要があります。すべて英語の文字でうまく動作しますが、東ヨーロッパやロシアの文字を送信しようとすると、ドキュメントに「?」と表示されます。いくつかの「ごみ」があります。また、私はそれらの文字をアプリケーションからアプリケーションに戻すことができません。 私の質問は以下のとおりです。 Word文

    5

    3答えて

    "\ xaf"、 "\ xbe"などの文字を含むテキストがあります。これは、this questionからわかるように、ASCIIでエンコードされた文字です。 PythonでそれらをUTF-8に変換したいと考えています。通常string.encode("utf-8")はUnicodeDecodeErrorを投げる。たとえば、codecs標準ライブラリのほうが良い方法がありますか? サンプル200

    4

    4答えて

    私はこの単語のすべての文字が単語パターンと一致するファイルにいくつかの単語を入れる正規表現をマウントしようとしています。 私の問題は、正規表現はアクセント付きの単語を見つけることができませんが、テキストファイルにはアクセント付きの単語がたくさんあることです。 cat input/words.txt | grep '^[éra]\{1,4\}$' > output/words_era.txt ca

    1

    4答えて

    私はしばしば、 "你好"のような単純な中国語のフレーズを使って、私のコードが非ASCII文字を扱えることをテストします。私がEmacsに直接中国語の文字を入力するたびに、彼らは疑問符として出てきます。 プレマドテキストファイルを開くと、Emacsで文字が正しく表示されることがあります。たとえば、メモ帳に「你好」という単純なテキストファイルを作成すると、好が表示されますが、你はボックスを表示します。

    0

    2答えて

    Google検索を実行してクエリの検索結果を取得する必要があります。私はここで答えを見つけました - Google Search from a Python App しかし、いくつかのクエリで私は以下のエラーが発生しています。私はクエリがユニコード文字を持っていると思います。 UnicodeDecodeError:「ASCII」コーデックは位置28のバイト0xc3をデコードすることができない。序な

    1

    2答えて

    ファイルのサイズは500MBです。 ASCII文字以外の文字がいくつかあります。私は、Unixコマンドを使ってそれらの文字を探したいだけです。各行で行番号と位置を取得する方がよいでしょう。 感謝:)

    1

    2答えて

    html文書であると思われるたくさんのファイルがありますが、時には編集者が他のソースからペーストしたテキストをコピーすることがあります。奇妙な文字 - 今のところ、非符号化された著作権表示やダッシュやマイナスのようなものだが他のもの(ascii#146?)や "..."のような一文字の奇妙なもの。 私はget_html_translation_table()を見ましたが、これは&のような "普通の

    0

    2答えて

    MVC 3アプリケーションを2つの言語enおよびfaで作成します。そして、検索エンジンで、私は(2 LANGに1ページ分)のように、URLでページのタイトルを使用するためのURLを最適化します mysite.com/en/Home/Sheet/2/my-presentation-page mysite.com/fa/Home/Sheet/2/صفحه-معرفی-من とルートマップは次のと

    22

    4答えて

    エコーを使用して非ASCII文字を書き込むにはどうすればよいですか? \012などのエスケープシーケンスはありますか? は、私が使用してファイルにASCII文字を追加したい: echo ?? >> file