2017-09-05 12 views
1

を分割されていない必要があります。しかし、これを行う間に、電子メールのIDも別のデータフレームに分割されます。誰でもデータを文に分割する手助けをすることができます。分割文章は、私は完全な停止や期間によって文章に段落を分割したい

例:

aa = "For Important Disclosure information, please visit our website at 0.5% https://javatar.bluematrix.com/sellside/Disclosures.action or call 1.888.JEFFERIES. An organization. 0.5% have an analysis." 

この

  1. For Important Disclosure information, please visit our website at 0.5% https://javatar.bluematrix.com/sellside/Disclosures.action or call 1.888.JEFFERIES.
  2. An organization.
  3. 0.5% have an analysis

コードに分割されるべきである:

sentences = as.matrix(unlist(strsplit(aa,"\\."))) 
+0

ここに述べたようにしたい場合はFYI、あなたは答えを "受け入れる" ことができます。https://stackoverflow.com/help/someone-answers – Frank

答えて

5

それが働いているようにこれが見えます:

strsplit(aa, '. ', fixed = TRUE) 
#[[1]] 
#[1] "For Important Disclosure information, please visit our website at 0.5% https://javatar.bluematrix.com/sellside/Disclosures.action or call 1.888.JEFFERIES" 
#[2] "An organization"                                   
#[3] "0.5% have an analysis." 
+0

どうもありがとう。あなたは私を救った:) – user1682140

+0

あなたは大歓迎です。私が助けてくれるとうれしいです:) – LyzandeR

+0

注意してください、これは失敗する他の文字列があります。 "Mr."、 "Dr." "例えば。"すべてが文末ではありませんが、ピリオドとスペースのパターンに従います。 https://github.com/ropensci/tokenizersのtokenize_sentencesのようなものを使用したい場合があります –

関連する問題