2016-05-05 3 views
3
sample1 = read.csv("pirate.csv") 
sample1[,7] 
[1] >>xyz>>hello>>mate 1 
[2] >>xyz>>hello>>mate 2 
[3] >>xyz>>mate 3 
[4] >>xyz>>mate 4 
[5] >>xyz>>hello>>mate 5 
[6] >>xyz>>hello>>mate 6 

最後に>>の後に続くすべての単語を含む配列を抽出して作成する必要があります。シンボルの後にテキストを抽出するR

これを行う方法?

また、どのように私は以下の文字列から

p= '>>xyz- o qwerty>>hello>>mate1>>sole pirate1' 

おかげ

+0

なぜ 'r'タグがあります。あなたは 'r'でそれを必要としますか? – Sotos

+0

はい、Excel形式のファイルからベクトル形式のrに列を抽出する必要があります – Looper

+1

引数のヘッダとnrowsを 'read.csv'で参照してください。これはあなたが読んで始めなければなりません。これについては、多くの疑問があります。 – lmo

答えて

5
x <- c('>>xyz>>hello>>mate 1', '>>xyz>>hello>>mate 2', '>>xyz>>mate 3', ' >>xyz>>mate 4' ,'>>xyz>>hello>>mate 5') 
sub('.*>>', '', x) 
#[1] "mate 1" "mate 2" "mate 3" "mate 4" "mate 5" 
+0

あなたはxベクトルの列7のすべての行の名前を与えています。 1)ベクトル内の列全体をどのように渡すことができますか(これらは6行だけですが、100行以上を扱います) 2)また、たとえば2つの特定のシンボル間のテキストを抽出したいとします。 >> xyz-qwerty >> hello >> mate1 >> pirate1 上記で私は2つの別々の変数でqwertyとhelloを抽出したいと思います。それで私を助けてください。 ありがとう – Looper

+0

個々の列を選択するには、 'x'を' sample1 $ ... 'または' sample1 [、7] 'に置き換えてください。他の用語を抽出するには、あなたの質問を更新し、それに関するいくつかの詳細を与える必要があります。 – Sotos

+0

質問が更新されました...今すぐお答えください。 – Looper

1
を(a)のO QWERTY配列、(b)はMATE1と異なる変数(c)においてpirate1を抽出することができます

すでにその原料を読むと仮定すると、次のようにRのデータフレームに、あなたはstringrパッケージを使用することができます。

library(stringr) 
str_extract(df$mystring, '\\S+$') 

たとえば、あなたがこのような文字列がある場合:

s <- '>>hello1>>hola1>>ahoy mate1' 

あなたが得る:

str_extract(s, '\\S+$') 
[1] "mate1" 
+0

または単に 'sub( '。*'、 '' '、s) 'しかし、私は彼の問題がRでデータをインポートすることと関係していると思います... – Sotos

+1

うん。同意する。私は人々をさまざまな問題のために必要に応じてより多くのことを行うことができるように、汎用性の高いパッケージに導きます。 – Gopala

+0

あなたの例の 'すべての単語が最後に' >>は 'ahoy mate1'でなければなりません – rawr