2017-08-01 9 views
3

私は以下の文字列を持っている:SQL Server内の文字列からセミコロンの前に単語を取得

Consolidation CompletedThe Scenario is LDP; the Year is 2018; the Start Period is July; the End Period is June; the Entity is TOT_NEWS.

をそして、ちょうどdot (.)

semicolon (;)と最後の単語の前の単語を取得する必要があります
Result: 
----- ---- ---- ---- ---- 
LDP 2018 July June TOT_NEWS 

私は以下の最初の1 LDPを得ることができた選択:

REVERSE(LEFT(REVERSE(SUBSTRING(strDescription, CHARINDEX('The Scenario 
is', strDescription,+39), 
CHARINDEX(';',strDescription,-1))), CHARINDEX (' ', 
REVERSE(SUBSTRING(strDescription, 
CHARINDEX('The Scenario is', strDescription,+39), 
CHARINDEX(';',strDescription,-1)))))) as Scenario 

しかし、残りの文字列では機能しません。ここで

+0

固定数のセミコロンはありますか? – Lamak

+0

SQLは本当にこれに使用する必要がありますか? – TZHX

+0

@Lamakはい、いつも同じ番号です。 –

答えて

1

ここに行く:

-- Defining your string 
DECLARE @string varchar(max) 
SET @string = 'Consolidation CompletedThe Scenario is LDP; the Year is 2018; the Start Period is July; the End Period is June; the Entity is TOT_NEWS.' 


;with pos as (
SELECT 
@string as String 
,CHARINDEX(';', @string, 1) as Pos_1 
,CHARINDEX(';', @string, CHARINDEX(';', @string, 1)+1) as Pos_2 
,CHARINDEX(';', @string, CHARINDEX(';', @string, CHARINDEX(';', @string, 1)+1)+1) as Pos_3 
,CHARINDEX(';', @string, CHARINDEX(';', @string, CHARINDEX(';', @string, CHARINDEX(';', @string, 1)+1)+1)+1) as Pos_4 
) , txt as (
select 
String 
,substring(String, 1,Pos_1-1) as String_1 
,substring(String,Pos_1+1,Pos_2-Pos_1-1) as String_2 
,substring(String,Pos_2+1,Pos_3-Pos_2-1) as String_3 
,substring(String,Pos_3+1,Pos_4-Pos_3-1) as String_4 
,substring(String,Pos_4+1,LEN(String)-Pos_4-1) as String_5 
from pos 
) 
SELECT 
string 
,substring(String_1,len(String_1)-charindex(' ',reverse(String_1),1)+1,charindex(' ',reverse(String_1))) as Result_1 
,substring(String_2,len(String_2)-charindex(' ',reverse(String_2),1)+1,charindex(' ',reverse(String_2))) as Result_2 
,substring(String_3,len(String_3)-charindex(' ',reverse(String_3),1)+1,charindex(' ',reverse(String_3))) as Result_3 
,substring(String_4,len(String_4)-charindex(' ',reverse(String_4),1)+1,charindex(' ',reverse(String_4))) as Result_4 
,substring(String_5,len(String_5)-charindex(' ',reverse(String_5),1)+1,charindex(' ',reverse(String_5))) as Result_5 
from txt 

出力:

string                                 | Result_1 | Result_2 | Result_3 | Result_4 | Result_5 
----------------------------------------------------------------------------------------------------------------------------------------|-----------|----------|----------|----------|--------- 
Consolidation CompletedThe Scenario is LDP; the Year is 2018; the Start Period is July; the End Period is June; the Entity is TOT_NEWS. | LDP  | 2018  | July  | June  | TOT_NEWS 
+2

これは正しい出力を生成しますが、これが大規模なデータセットの場合、パフォーマンスはかなり悪くなります。逆はひどく遅い関数であり、ここでの関数のせん断量だけではこのスケールをうまく行かせることはできません。しかし、それは動作します。 –

+0

はい、もちろん読めませんでしたが、私は彼が使用した関数を使いたいと思っていましたが、この場合は結果が一列に並んでいます。 3つのネストされたループ;-)はい - 私は完全にaggreeと私は大量のデータでこれをお勧めしません! – tgr

+2

理想的には、OPは恐ろしいデータを修正し、このような区切られた情報の格納をやめ、それを分割する必要はありません。 :) –

2

が文字列スプリッタを使用した方法です...

declare @value varchar(max) = 'Consolidation CompletedThe Scenario is LDP; the Year is 2018; the Start Period is July; the End Period is June; the Entity is TOT_NEWS.' 

;with cte as(
select 
* from 
dbo.DelimitedSplit8K(@value,';')) 

select 
    replace(right(Item,charindex(' ',reverse(Item),1)),'.','') 
from cte 

FUNCTION

CREATE FUNCTION [dbo].[DelimitedSplit8K] (@pString VARCHAR(8000), @pDelimiter CHAR(1)) 
--WARNING!!! DO NOT USE MAX DATA-TYPES HERE! IT WILL KILL PERFORMANCE! 

RETURNS TABLE WITH SCHEMABINDING AS 
RETURN 

/* "Inline" CTE Driven "Tally Table" produces values from 1 up to 10,000... 
enough to cover VARCHAR(8000)*/ 

    WITH E1(N) AS (
       SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
       SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
       SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 
       ),       --10E+1 or 10 rows 
     E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows 
     E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max 
cteTally(N) AS (--==== This provides the "base" CTE and limits the number of rows right up front 
        -- for both a performance gain and prevention of accidental "overruns" 
       SELECT TOP (ISNULL(DATALENGTH(@pString),0)) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4 
       ), 
cteStart(N1) AS (--==== This returns N+1 (starting position of each "element" just once for each delimiter) 
       SELECT 1 UNION ALL 
       SELECT t.N+1 FROM cteTally t WHERE SUBSTRING(@pString,t.N,1) = @pDelimiter 
       ), 
cteLen(N1,L1) AS(--==== Return start and length (for use in substring) 
       SELECT s.N1, 
         ISNULL(NULLIF(CHARINDEX(@pDelimiter,@pString,s.N1),0)-s.N1,8000) 
        FROM cteStart s 
       ) 
--===== Do the actual split. The ISNULL/NULLIF combo handles the length for the final element when no delimiter is found. 
SELECT ItemNumber = ROW_NUMBER() OVER(ORDER BY l.N1), 
     Item  = SUBSTRING(@pString, l.N1, l.L1) 
    FROM cteLen l 
; 
GO 

Creator of the Function

+0

シュート、それは私がコピーして貼り付けたときに底を切り取った。ヘッドアップのおかげで@SeanLange – scsimon

2

あなたはTVF(表値関数)を開いている場合。

このアプローチでは、変更された分割/解析機能が使用されます。 1つの区切り文字ではなく、2つの非区切り区切り文字を使用します。またこの場合' 'と​​3210

Declare @YourTable table (id int,strDescription varchar(max)) 
Insert Into @YourTable values 
(1,'Consolidation CompletedThe Scenario is LDP; the Year is 2018; the Start Period is July; the End Period is June; the Entity is TOT_NEWS.') 

Select A.ID 
     ,B.* 
From @YourTable A 
Cross Apply (
       Select Pos1 = max(case when RetSeq=1 then RetVal end) 
        ,Pos2 = max(case when RetSeq=2 then RetVal end) 
        ,Pos3 = max(case when RetSeq=3 then RetVal end) 
        ,Pos4 = max(case when RetSeq=4 then RetVal end) 
        ,Pos5 = max(case when RetSeq=5 then RetVal end) 
       From [dbo].[udf-Str-Extract](A.strDescription+';',' ',';') 
      ) B 

戻り

ID Pos1 Pos2 Pos3 Pos4 Pos5 
1 LDP  2018 July June TOT_NEWS 

UDFもし興味が

CREATE FUNCTION [dbo].[udf-Str-Extract] (@String varchar(max),@Delimiter1 varchar(100),@Delimiter2 varchar(100)) 
Returns Table 
As 
Return ( 

with cte1(N) As (Select 1 From (Values(1),(1),(1),(1),(1),(1),(1),(1),(1),(1)) N(N)), 
     cte2(N) As (Select Top (IsNull(DataLength(@String),0)) Row_Number() over (Order By (Select NULL)) From (Select N=1 From cte1 N1,cte1 N2,cte1 N3,cte1 N4,cte1 N5,cte1 N6) A), 
     cte3(N) As (Select 1 Union All Select t.N+DataLength(@Delimiter1) From cte2 t Where Substring(@String,t.N,DataLength(@Delimiter1)) = @Delimiter1), 
     cte4(N,L) As (Select S.N,IsNull(NullIf(CharIndex(@Delimiter1,@String,s.N),0)-S.N,8000) From cte3 S) 

Select RetSeq = Row_Number() over (Order By N) 
     ,RetPos = N 
     ,RetVal = left(RetVal,charindex(@Delimiter2,RetVal)-1) 
From (
     Select *,RetVal = Substring(@String, N, L) 
     From cte4 
     ) A 
Where charindex(@Delimiter2,RetVal)>1 

) 
/* 
Max Length of String 1MM characters 

Declare @String varchar(max) = 'Dear [[FirstName]] [[LastName]], ...' 
Select * From [dbo].[udf-Str-Extract] (@String,'[[',']]') 
*/ 
+1

私はあなたからそれを見て、それを忘れたこの最後の時間を実際に保存しました。ダハハハ。私からの1 – scsimon

関連する問題