SQL Serverに本文を格納しています。SQL ServerでUnicodeテキストを検出する
一部の本文には、SQL Server内のVARCHAR
列に格納するときに失われるUnicode文字が含まれています。
格納されるテキスト本文のほんの一部にNVARCHAR
の列が必要なので、VARCHAR
のテキストとNVARCHAR
のテキストの2つの列を作成することにしました。この方法では、テキストのUnicode本体をNVARCHAR
列に格納し、残りをVARCHAR
列に格納するだけで、スペースを節約できます。
質問:テキストの本文にUnicode文字が含まれているかどうかを検出して、それを格納するのに最適な列を判断できるようにするにはどうすればよいですか?
圧縮の使用は好ましいオプションのように聞こえますが、ネイティブSQL圧縮を使用してフィールドを圧縮できる程度には限界があると思います。 SQL CLRライブラリを使用してgzipなどの圧縮を実装する可能性があります。 –
@EliPerpinyalの行とページの圧縮([unicode圧縮](https://technet.microsoft.com/en-us/library/ee240835(v = sql.110).aspx)を含む)は、行に格納されたデータにのみ適用されますラージオブジェクトデータではありません。 SQL Server 2016には、GZIP圧縮用のCOMPRESS関数が組み込まれています。 –