2016-07-12 5 views
1

RStudioコンマに等しくない場合、私は私がCSV2コンマからデータをインポートする

read.csv2('~/My/File/place.csv',sep=";") 

のおかげで細胞のいくつかは、コンマを持っていると私は特定の値にそれらを比較しようとすると、RにインポートするExcelファイルを持っていますコピーでは

> "‚"=="," 
[1] FALSE 

または

> "‚"%in%"," 
[1] FALSE 

/PRを貼り付ける:Rスタジオで私のようないくつかのかなり奇妙な行動を持っていますあなたは正常に同じことが起こっているのを見ることができます。

もちろん、私がインポートしていないデータでこの種のテストを試みると、何の問題もありません。

誰もがこのようなことが起こっている理由を知っていますか、それを修正する方法があるのですか?

答えて

1

コンマのように見える左手の表現は、実際にはsingle low-9 quotation mark in Unicodeです。 、私たちは生のビットチェックすることができますが、上記の持っているものから&貼り付けをコピーします。これを固定すると、

(yy <- c(LHS = "\U201A", RHS = "\U002C")) 
#LHS RHS 
#"‚" "," 

xx[1] == yy[1] 
# LHS 
#TRUE 

xx[2] == yy[2] 
# RHS 
#TRUE 

をUnicodeからこれらを再作成

xx <- c(LHS = "‚", RHS = ",") 

charToRaw(xx[1]) 
#[1] e2 80 9a 

charToRaw(xx[2]) 
#[1] 2c 

charToRaw(",") ## typed in manually 
#[1] 2c 

を、私はそこにあるかわかりませんあなたのコンピュータがこれらの記号が似ていることを理解していないか、両方をカンマで扱いたいと思っていないからです。私はあなたのデータをASCII以外の文字でスキャンすることをアドバイスします。この機能は、?rawヘルプファイルから取得します。

isASCII <- function(txt) all(charToRaw(txt) <= as.raw(127)) 
sapply(xx, isASCII) 
# LHS RHS 
#FALSE TRUE 
関連する問題