2017-02-03 22 views
1

質問は非常にシンプルですが、私は単一の文字 '...'の上にgoogleすることはできませんmatlab。Matlab ...文字列分割の文字 - 削除するには?

DELIMS = {' ', '.', ',', '?', '\n'}; 
email = fileread(file_path); 
email = strsplit(email, DELIMS); 

これだけです。

:もともと、文字列は次のようになります - そしてそれは続けて "!件名... slze事項6 ppntufbis aqtdaibnuf jmxdzjdyjskm noyrhrcsltyiyc yfcgqhbjrw noqqngttnymi ljpdpfbocwqnjb 唯一の解決策には87、847本のボトル毎日販売"。これは男性増強薬のスパムメールに関するものなので、残りの部分は掲載しません。私は、この文字列に分割

とき、私は次を得る:

Columns 1 through 4 

'Subject:' '87' '847' 'bottles' 

Columns 5 through 8 

'sold' 'daily' '-' 'slze' 

Columns 9 through 12 

'matters' '!' '6' 'ppntufbis…' 

Columns 13 through 14 

'aqtdaibnuf' 'jmxdzjdyjskm' 

Columns 15 through 16 

'noyrhrcsltyiyc' 'yfcgqhbjrw' 

Columns 17 through 18 

'noqqngttnymi' 'ljpdpfbocwqnjb…' 

検査の際に、私たちは本当に1つの文字であるこれらの...文字を参照してください。私はこれらが\ n文字であると仮定しています(これは削除すべきです)。私はこれらを取り除きたいのですが、Googleはこれらの文字を実際のクエリとして認識しないため、これらの文字は何か分からなくなってしまいます。 C++の背景から来て、これは非常に混乱しています。どんな助けもありがとう!

whos email 
Name  Size    Bytes Class Attributes 

email  1x125   15252 cell 


email{12} 

ans = 

ppntufbis 


char(email{12}) 

ans = 

ppntufbis 
+0

ユニコード[水平省略](http://www.fileformat.info/info/unicode/char/2026/index.htm)のように見えます。 – beaker

+0

テキストに正確な例文を使ってR20105bで再現できません。どのようなMatlabのバージョンを使用していますか? –

+0

@LuisMendo私はR2016bを使用しています。とビーカーは、ユニコードからキャストする潜在的な解決策ですか?おそらく、それはファイルのフォーマット自体のためです。私はあなたにそれを送ることができますが、実際にスタックオーバーフロー時にオンラインでファイルを投稿することはできません。 – OneRaynyDay

答えて

2

したがって、私は解決策を見つけることができました。

'...'は、実際にMatlabの表示方法です。具体的には次の行(空であってもなくてもかまいません。

自分の区切り文字を指定したときに、改行文字\ nを含めると考えましたが、このファイルは古くて\fを使用していました。そうでなければMatlabは私に教えてくれなかったので、私は実際に線で分けることができたと思った。