データに区切り文字が含まれていても残りの文字列がどのように区切られますか?列が不均一/不等な文字列と区切り文字なしで区切る
入力: ID
142 TM500A2013PISA8/22/17BG
143 TM500CAGE2012QUDO8/1720分の22 +
出力:
カテゴリサイト菜園年の種日部分 142 TM 500 A 2013 PISA 8/22/17 BG 143 TM 500 CAGE 2012 QUDO 8/22/17 20+
私は他の質問の周りつつい、それはつまり、同じ文字列であれば動作するかもしれ何かを試してみました:
>df <- avgmass %>% separate(id, c("site", "garden", "plot", "year",
"species", "sampledate", "portion"),sep=cumsum(c(2,3,3,4,4,5)))
しかし、プロットIDはどちらかであるAなど、BまたはCAGE;日付は "/"です - 私はそれにどのように接近するか分かりません。
私はRに比較的新しいので、sep引数を使用する方法の詳細については検索してみましたが、役に立たなかった...助けてくれてありがとう。
それは固定長でない場合、 '?extract' – akrun
としてみてください、あなたは我々がそれらの文字と数字が何を意味するか見当がつかない期待出力 – akrun
を示すことができました。フィールドを分割するルールは何ですか?なぜこのようなデータがフォーマットされているのですか? – MrFlick