language-detection

    3

    1答えて

    私は物事のデータベースを持っていますが、それぞれが異なる言語で複数の名前を持つことができます。 things ------ id ... names ----- id thing_id language name 私はこの使用してSolrのインデックスを作成していますし、Luceneのスキーマにこれを非正規化するための最良の方法を把握しようとしています:これは事がある -

    5

    2答えて

    私は、英語のフォーラムサイトをperlで書いてあり、ロシア語で迷惑メールに絶えず攻撃されています。 Perlと正規表現を使ってロシア語のテキストを検出してブロックする方法はありますか?

    4

    7答えて

    まず、私は多くのテキストを入手できます。私はそれぞれの試行に10000文字を持っているとしましょう。 スクリプトはPHPに基づいていますが、私は何でも好きなものを使用できます。 C++、Java、問題ありません。 GoogleのAPIは使用できません。その使用制限は低いです。 私は6時間、私は素晴らしい何かを出そうとしていますが、今はありません。誰かが私のベストチャンスを教えてくれる?

    1

    4答えて

    私は自分のウェブサイトの複数の言語バージョン(英語とドイツ語など)を使用したいと考えています。私は、ユーザーの言語に基づいて合理的なデフォルトを提供したいと思います。 これを行うには、最も簡単で妨げのない方法は何ですか? EDIT:理想的な解決策は、サーバー側の技術を使用するのではなく、htmlファイルのすべてをエンコードすることです。現在、メインページに自動転送する開始ページがあります。可能であ

    5

    1答えて

    apache tikaツールキットでfarsi言語のWebページを検出するのに役立つサンプルコードが必要です。 LanguageIdentifier identifier = new LanguageIdentifier("فارسی"); String language = identifier.getLanguage(); 私はapache.tika jarファイルをダウンロー