2017-08-25 9 views
-2

私はプログラミングに慣れていません。 私は私が見つけるRに私のデータをロードする場合:; $のgene_assignmentから(--- " """)これらの条件に従ってRを使用してデータを並べ替えるにはどうすればよいですか?

>str(g) 
data.frame': 253227 obs. of 2 variables: 

$ ID    : int 7896741 7896743 7896745 7896747 7896749 7896751 7896753 7896755 7896757 7896758 ... 
$ gene_assignment: Factor w/ 85855 levels "","---","AB001736 // IGLJ3 /// AB001733 // IGLJ3 /// ENST00000390609 // IGHV3-23 /// X14584 // IGHV3-23 /// BC072419 // "| __truncated__,..: 16002 81923 16018 2 2 2335 2 2392 5497 5497 ... 
  1. どのように私は、2つのカテゴリを削除することができますか?どのような種類のコードを使用しますか?

  2. “ AB001736 // IGLJ3 /// AB001733 // IGLJ3 /// ENST00000390609 // IGHV3-23 /// X14584 // IGHV3-23 /// BC072419 // "|

この要因は、多くのパラメータが含まれていますが、一部はENST00000390609またはAB001733のような共通しています。これらの値を削除するにはどうすればよいですか?

+0

[条件付きでRでデータフレーム行を削除する]の可能な複製(https://stackoverflow.com/questions/8005154/conditionally-remove-dataframe-rows-with-r) –

答えて

0

私はあなたが求めているものを本当にはわからないので、私はあなたが何をしたいのかを解釈することができます。理想的には、私はコメントを残していただろうが、50以上の評判が必要だと私に伝えている。あなたが欠落している値(NAS)で、あなたの因子変数の二つのカテゴリーを交換したい場合は


ので、これは動作するはずです:

data.frame$gene_assignment <- ifelse(data.frame$gene_assignment==...,NA,data.frame$gene_assignment) 

...ある目標値またはカテゴリをNAは新しい値(欠落)で、残りは他のすべての値とカテゴリを変更しないためのものです。

同じコードは、あなたの第二の問題のために、明らかに、使用することができます。目標値(1つのコースでは1つ)とそれを置き換える値を入力してください。

data.frame$dummy<-ifelse(data.frame$gene_assignment=...,1,0) 

を指定した値に基づいて、あなたのdata.frameから行(リストごと)を削除したい場合は:それはあなたが欲しいものだ場合にも、そのように非常に簡単にダミーを作成することができます

特定の変数(例えば、$ gene_assignment)の値(例えば、 "---")であれば、data.frame[!(data.frame$gene_assignment=="---"),]またはそれ以下:subset(data.frame, gene_assignment!="---")がこのトリックを行うべきです。あなたはあなたのNAを見なければなりません。


これを参考にしてください。

ない場合は、ケースには私はあなたが彼らにあなたが質問を書いている方法を改善するために何ができるかを見てみましょう、あなたの質問を誤解。詳細は鍵となり、「再現可能な例」(いくつかの例示的なデータ)は、応答しやすくなり、より良い回答を得られます(herehere、およびhereを参照)。

+0

また、質問をする前にリサーチを行う必要があります誤って既存のものを複製することはありません。この[post](https://stackoverflow.com/questions/31331217/remove-values-in-vector-from-double-variable-in-r)と[this](https:// stackoverflow)を見てください。 .com/questions/8005154 /条件付き - 削除 - データフレーム - 行 - r)も。 –

+0

@gene:私はあなたの "答え"の下で私に作家をさせてくれないので、私はここでコメントしています(私は "回答ではない" btwと旗を立てました)。 **ご質問について:** Rのデータを読み込もうとしたときに問題が発生したようです。列の右区切り文字を指定してください(Excelシートで使用されているように)。デフォルトではこれは "、"ですが、別のものにすることができます。 'sep =" ... "'はそのトリックを行います。データをロードする方法については '?read.table'を実行してください。また、StackOverflowに関するいくつかの調査をしてください:似たような質問をたくさん持っている人がたくさんいます。 –

関連する問題