2017-07-14 18 views
0

私はRStudioでデータを再生してレトロシート演奏をしていますが、ピッチシーケンスの列から非ピッチング文字(ピックオフ試行、ボークなど)を削除しようとしています。たとえば:テキスト文字列から特定の文字と数字を削除する

データセット私が持っている:

PITCH_SEQ_TX <- c('SSS.C', 'FFBB1', 'BBSSC', 'B.BSS2', 'CBSFFFS') 

データセットは、私がしたい:私はテキスト文字列から句読点や数字を削除する方法を把握する必要があり

PITCH_SEQ_TX <- c('SSSC', 'FFBB', 'BBSSC', 'BBSS', 'CBSFFFS') 

文字だけが残るようにします。私はgsub機能コード行のカップルを試してみましたが、正しい組み合わせを把握できないようです。どんな助けもありがとう。

+0

Rを使用しています。Rstudioは統合開発環境(IDE)です。 –

答えて

1

あなたは

PITCH_SEQ_TX <- c('SSS.C','FFBB1','BBSSC','B.BSS2','CBSFFFS') 
gsub("[[:punct:][:digit:]]+", "", PITCH_SEQ_TX) 

またはすべての非アルファを削除するを使用することがあります。

gsub("[^[:alpha:]]+", "", PITCH_SEQ_TX) 

R demo

[[:punct:][:digit:]]+が原因に(1以上に一致するブラケット表現である参照してください。 +)句読点([:punct:])または数字([:digit:])文字で、[^[:alpha:]]は、文字ではない任意の文字に一致する否定された括弧の式です。

関連する問題