EDITを、不要な文字を削除します。ここに私の現在のコード(21233664文字)があります巨大なファイルから
string str = myInput.Text;
StringBuilder sb = new StringBuilder();
foreach (char c in str)
{
if ((c >= 'a' && c <= 'z') || c == '_' || c==' ')
{
sb.Append(c);
}
}
output.Text = sb.ToString();
のは、私はアンダースコアで特殊文字と通常の表現が含まれている巨大なテキストファイルがあるとしましょう。
- super_test
- テスト
- another_super_test
あなたが見ることができるように、唯一の下部ケース:ここ
は私が探している 文字列のいくつかの例であり、文字はアンダースコアで許可されます。 私はこのようになりますテキストファイルにそれらの文字列を持っている場合今、:> §> ˜;@ ®> l? super_test D>ÿÿÿÿ “G? tI> €[> €? È
私が直面してる問題は、いくつかの孤独な文字がまだ保存されていることです。上記の例では、出力は次のようになります。これらの文字の乗っ取得するために
l super_test t
、私はもう一度ファイル全体を経なければならないが、ここでは私の質問です:どのように私は手紙は孤独であるかどうかを知ることができます?
私は正規表現の可能性を理解していないので、誰かが私にヒントを与えることができれば本当に感謝します。
私はそれはそれは – dasblinkenlight
方法」:-)泣いている時に文字が孤独であると言うことはかなり安全だと思います寂しい "と話していますか? Regexに最小長さの要件を追加することができます。 – AntiTcb
「巨大」の大きさはどれくらいですか?どのようにフィルタリングを行うのですか? –