2016-08-26 15 views
-1

これはどこかで答える必要がありますが、見つけられないようです。私は数字の文字列、特に記号を含まない文字列(_、。#など)を特定しようとしています。 10より長い整数の文字列を識別するシンボルを含むが、シンボルを含むものは除外する式を書くにはどうすればよいですか?正規表現では演算子がありません

"49154" "Reader #1" 0.585069444444445 28 "LA" "982" "000088261962" "01/29/10" "14:02:30" 1 
"49159" "Reader #1" 0.585081018518519 28 "LA" "982" "000088261962" "01/29/10" "14:02:31" 1 
"49160" "Reader #2" 0.585127314814815 28 "LA" "982" "000088261962" "01/29/10" "14:02:35" 1 
"49163" "Reader #2" 0.585138888888889 28 "LA" "982" "000088261962" "01/29/10" "14:02:36" 1 

私が何かしようとしたします。grepを( "[0-9] {10,20}")が、私は、列#8を特定するが、個人的に#4

+4

おそらく "^ [0-9] {10、} $" – HubertL

+2

'dput'あなたが使用しているデータ – rawr

+0

このサイトは私の正規表現の問題をすべて解決しますhttp://regexr.com/。ところで、私はこのRのための良い非正規表現の答えを持っていますが、あなたのタイトルとタグは正規表現だと私は答えとしてそれを投稿することはできません:/ –

答えて

1

を除外し、あなたの特定のためにしたいのですがケース(長さ10以上の整数の文字列が)、私はこのようなものでいいと思う:

\d{10,} 

あるいは、Rの正規表現エンジンはサポートされていない場合\d

[0-9]{10,} 

あなたが文字列の前に、オプションの小数点以下の値と一致する場合は、これを使用することができます:

([0-9]+\.)?[0-9]{10,} 

はいつもあなたが一致させたい文字列を可能な限り最も特定のパターンを使用して、覚えておいてください。より一般的なパターンでは、あなたが望んでいない文字列をフィルタリングしようとする行頭に頭痛が増えます。

関連する問題