文字列のメソッドを簡単に呼び出して英語以外の文字列を見つけることができるライブラリはありますか?私は英語の文字列を保存しようとしています。文字列の入ってくるストリームには英語以外のものがたくさんあります。文字列が英語かどうかを調べる
0
A
答えて
2
あなたはlinguoを使用しようとすることができます。
"your string".lang
# will return "en" for english strings
免責事項:私はこの宝石の創作者です。
0
私は認識していませんが、このリストを配列(http://www.langmaker.com/wordlist/basiclex.htm)に入れて、その文字列の単語と照合することができます。いくつかのパーセンテージを良いものとして決め、そこから行く。
ベイジアンアルゴリズムを使用して、これらの単語を「良い」とマークし、そこから学ぶこともできますが、それは過度の可能性があります。
1
あなたはそれのためにRailsBridgeとGoogle翻訳のAPIを使用することができます - http://code.google.com/apis/gdata/articles/gdata_on_rails.html
「英語以外」とは何ですか? 「港を救ってください!」英語? "c u l8r"ですか? – Gareth
英語英語、またはアメリカ英語? "港を救う!" ;-) – Pavling
'私は文字列のメソッドを簡単に呼び出すことができます'と '非英語の場合'が英語以外であると思います。 – sawa