現在、私が行っているプロジェクトではウィキペディアのスクレーパーを作成しています。問題は、文字列を比較しようとするときに私のコードがバグを生成することがあることです。もし私が同じように見える文字列を持っていると、それらは時々異なったものとして登録されます。例:異なるスペースと可能性のあるヌル文字を含む文字列を比較する
var elementText = $("selector").text();
console.log(elementText); // "abc def"
console.log(elementText === "abc def"); // false
私のコードで検出された奇妙な文字を使用しているようです。私は試してみました:
elementText.replace(/\s+/g, '')
を試してみましたが、いずれもうまくいかないようです。直感的に等しい文字列が実際に等しくなるように、これらの文字を完全に取り除くにはどうすればよいですか?
注:==
でコードをテストしましたが、問題を修正するようです。しかし、将来のバグを避けるために、私はこの修正プログラムの使用を避けたいと考えています。
[データベース全体を無料でダウンロードできます](https://en.wikipedia.org/wiki/Wikipedia:Database_download)もご存知でしたか? – Liam
@Liam私はしませんでした。私は間違いなくこれを調べます。それは、私はまだこの問題を回避する方法を知りたいと思っています。 – Bluefire
Wikipediaでは、改行しないスペースと薄いスペースを使用しています。そして、それでも '\ s'はそれらと一致するはずです。あなたがその正規表現で何をやってみたのか正確に教えてください。 – Bergi