2016-10-12 1 views
0

Rのスペース/単語境界に基づいて文字列を分割するにはどうすればよいですか?Rの単語境界に基づいて文字列を分割するにはどうすればよいですか?

t = "ID=gene:Bra032485;biotype=protein_coding;description=AT5G40170 (E%3D6e-176) AtRLP54 | AtRLP54 (Receptor Like Protein 54)%3B kinase/ protein binding ;gene_id=Bra032485;logic_name=glean;version=1" 

私はこれを試してみましたが、それは私が欲しいの出力が

ID=gene:Bra032485;biotype=protein_coding;description=AT5G40170 
+0

ご希望の結果が何さ

sub("([A-Za-z1-9]+)+[[:space:]]","\\1",t) 

を働いていませんでしたか? –

+0

希望の出力も含めることができます。 –

+1

'(^ [:スペース:])+)。*"、 "\\ 1"、t) ' –

答えて

0
> strsplit(t, " ")[[1]][1] 
[1] "ID=gene:Bra032485;biotype=protein_coding;description=AT5G40170" 
+0

データフレーム内のカラムでコードを実行し、カラム内の各エレメントが分割後に長さが変わるため、' strsplit'を使用したくありません。 – upendra

+0

@upendraその場合、より一般的な答えを出すために、再現可能な例とデータのサンプルを提供する必要があります。あなたは、特定の質問に対する一般的な答えの後にいます。 –

+0

@ Jilber。私はこれを覚えておきます。私は質問をシンプルにしたいと思いましたが、私は再現可能な例を提供する必要があることを認識しませんでした – upendra

関連する問題