unicode

    0

    1答えて

    が 私の基本的なコードは、ファイルがパスに基づいて、exitenceチェックしようとしている、UTF-8文字を使用した作業が、それは、Unicode文字を扱うことができません:入力(つまり、ファイルパス Scanner scanner = new Scanner(System.in); String input = scanner.nextLine(); File f =

    0

    1答えて

    Es ist eines der Wahrzeichen Bambergs: das Alte Rathaus, auch Insel- oder Brückenrathaus genannt, das die frühere Herrschaftsgrenze zwischen der bürgerlichen Inselstadt und der すべて

    0

    1答えて

    私はJavascriptのUIをエンドポイントと話しています。エンドポイントは、パスフレーズチャレンジをJSONオブジェクトの配列として返します。各オブジェクトは、パスフレーズと文字コードポイント値の文字インデックスを持っていました。 [{"index":3,"nValue":101},{"index":5,"nValue":114},{"index":6}] コードポイントを文字に戻すのが苦

    1

    1答えて

    のWindows 7のGit Bashの/ WinPTY下のpython3で作業をUnicode文字を矢印、制限付きユーザーアカウントが実行されている Gitのgit version 2.14.1.windows.1 MINGW/MSYS MINGW64_NT-6.1 REDACTED 2.8.2(0.313/5/3) 2017-07-12 15:35 x86_64 Msys PythonのPyt

    2

    1答えて

    Unicode標準のすべてのコードポイントには、固有の英語名が付けられています。ドイツ語、フランス語、日本語などの言語へのこれらの名前(小さなコードセットのサブセットの場合)の翻訳が必要です...私はプロの翻訳者にアクセスできるので、これらの名前を1つずつ翻訳することはもちろん可能ですが結果は必ずしもUnicode標準の意図をよく表しているわけではありません。 Unicode委員会が既に英語以外の

    0

    2答えて

    だから私はユーザー提供の文字列で検索/フィルタリングする必要があるSTLベクトルを持っています。 (この特定のユースケースでそれを行う特定の/より良い方法がある場合は、これを言及してください) 現在のところ、このコードを繰り返し実行することで、それは一致します。 しかし、私たちの問題はアクセント付きの文字に由来します。私たちの望むふるまいは、発音区別(diacritics)に関係なく文字列を一致さ

    0

    1答えて

    これは、Unicode spacesです: U + 0020 SPACE U + 00A0 NO-BREAK SPACE U + 1680オガム文字SPACE MARK U + 2000 EN QUAD U + 2001 EM QUAD U + 2002 EN SPACE U + 2003 EM SPACE U + 2004 THREE-PER-EM SPACE U + 2005 FOUR-PER

    1

    1答えて

    テキストと絵文字の両方を含むFacebookからのコメント(Sprinkrのようなシステム経由で引っ張られている)があり、Rでさまざまな分析を実行しようとしていますが絵文字を正しく摂取することが難しくなります。例えば :私はこのような何かを含むメッセージ行を持つことになります(UTF-8でエンコード).CSVを持っている: 「これは正しいです、それは真実ではないと言うて下さい!?!?!今 libr