私は、mysql dbからSOLRインデックスにデータを注入する必要があります。私のDBの中のpbは私のDBでUTF8であり、アクセントがあるのでLATIN1でそれらを変換する必要があります。 考えていますか?SOLR + Mysql:utf8をlatin1に変換する方法
答えて
一般に、UTF8は現在Unicodeの全範囲に及ぶため、現在は1,112,064コードポイント、Latin1は256個以下です。あなたのテキストがLatin1で完全にカバーされている言語であれば、255を超えるコードポイントを表すUTF8文字を単に除外することができます(これを行う実際の方法は使用している技術に依存しています。
あなたの言語では256文字以下の文字が使用されていても、テキストにはUTF8以外の文字以外の文字が含まれている可能性があります。これは一般的な問題ですが、Latin1を検索エンジンインデックスあなたはおそらく文字以外の文字を無視することができます(これらはemojis、今日のネットでは非常に一般的な文字、YMMVを含みます)
私はなぜUTF-8を使うことができないのか分かりません。
ok、その場合、私はsolrを使ってはいけません。私は私のdataimportを起動すると、私はインスタンス "Vincent 5Ã"私のデータベースと私のsolrで "ヴィンセント5à"を希望している。多分それはsolr設定の問題でしょうか?手伝って頂けますか ? – Vince
さて、[ここ](https://wiki.apache.org/solr/FAQ#Why_don.27t_International_Characters_Work.3F)を始めることができます。より多くのヘルプが必要な場合は、関係するすべてのサーバーやクライアントで使用しているオペレーティングシステムとアプリケーションソフトウェア、発行するコマンド、関連するすべての詳細を指定して質問を編集する必要があります。あなたが書いたもの( "Vincent 5Ã")から、私はSolrにインポートするよりDBから正しくエクスポートすることがより問題になると思うでしょうが、詳細は言えません。 – Dario
- 1. mongodbでlatin1をUFT8に変換する
- 2. latin1をUTF8に変換する
- 3. latin1をUTF8に変換するPython
- 4. XML latin1をUTF-8と他の方法で変換する
- 5. 既存のデータベースの中でlatin1データをutf8に変換する
- 6. MySqlデータをLatin1からUTF8に変換する
- 7. PostgreSQLのlatin1エンコーディングでUTF-8のvarcharをbyteaに変換する
- 8. テーブルのlatin1をutf8に変換する際の問題
- 9. latin1文字列をutf8に変換しますか?
- 10. solrホームデータディレクトリを変更する方法
- 11. solrの日付をjavascriptの日付に変換する方法は?
- 12. Iconvを使用してUTF-8からlatin1に変換する際のエラー
- 13. Solrを使用してutf8データを含むlatin1カラムをインデックス化する
- 14. import utf-8 mysqldumpをlatin1データベースに変更
- 15. Latin1でエンコードされたData.ByteStringとData.Textの間の変換
- 16. iconv未知のソースからlatin1への変換
- 17. SOLRにmysqlテーブルをインポートする方法
- 18. StringをJSONに変換してオブジェクトに変換する方法
- 19. latin1からutf8への変換後にデータが切り捨てられます
- 20. SitecoreのカスタムLuceneインデックス設定をSolrに変換する
- 21. Solr/Lucene:「ワード数」を数値に変換するフィルタ
- 22. solr replication Solrインデックス互換性
- 23. 変換オブジェクトを配列に変換する方法
- 24. バックグラウンドでmp3をflvに変換する方法:変換エラー
- 25. リストの変換方法<Objects>をObservableRangeCollectionに変換する
- 26. UCHARをバイナリに変換する方法
- 27. int []をuint8 []に変換する方法
- 28. jobjectをjstringに変換する方法
- 29. リストをdictに変換する方法
- 30. IQueryableをDataTableに変換する方法
SolrはネイティブにUTF-8を使用しますが、DBが実際には接続のためにUTF-8を使用していることを確認してください(ドライバが接続しているときは 'SET NAMES UTF8;'可能な場合はJDBC文字列を使用します)。 – MatsLindh