2017-06-21 14 views
0

データフレーム(df1)が単一のデータ列としてスクラップされています。Rデータクリーニング

1 
2 Amazon Pantry 
3 Best Sellerin Soaps & Hand Wash 
4 
5 Palmolive Hygiene-Plus Sensitive Liquid Hand Wash, 300ml 
6 Palmolive Hygiene-Plus Sensitive Liquid Hand Wash, 300ml 
7 £0.90 
8 ? 
9 
10 Palmolive Naturals Nourishing Liquid Hand Wash, 300ml 
11 Palmolive Naturals Nourishing Liquid Hand Wash, 300ml 
12 £0.90 
13 ? 
14 
15 L'Oreal Men Expert Carbon Protect Deodorant 250ml 
16 L'Oreal Men Expert Carbon Protect Deodorant 250ml 
17 £1.50 

データを消去するために、以下のコマンドを使用して、商品と価格情報を2つの別々の列で取得しようとしました。別の方法がある場合は誰かに教えてもらえますか?

install.packages("splitstackshape") 
newdf <- cSplit(df1, "Amazon_Normal_Text2", direction = "long") 

答えて

0

これだけの思考プロセスである...

  1. 毎回「mlは、」スペースがあるまでmlが後方に行くまでの情報を抽出し、ボリューム変数にそれを保存するがあります。 (substr
  2. £からの情報を文字列の末尾に抽出し、price変数に格納します。 (grepregexnchar)製品変数にボリュームの発生のための文字位置までの文字列の先頭から
  3. エキス(substrnchar

ルックsubstrに、nchargrepregex

関連する問題