2017-03-19 6 views
0

こんにちは、私はLASSOに関する質問があります。私は私のバックグラウンドだけでは解決できないものなので狂っている。私は生物学者です。簡単に私は、Rライブラリ "penalized"を使ってLASSOを実行します。特に、私はテストしたいバイオマーカー(遺伝子発現)である約30列のdata.frame(数値)と約50個の腫瘍が存在する3000行の全行で、約500のシミュレーションを使ってopt1D関数を使用しました。他は法線です。残念なことにL1の正則化を使用することで、500シミュレーションのすべての係数が0になります。係数のL2行列をチェックすると、0に近くなります。私の主張は、すべてのバイオマーカーが法線と腫瘍。私がしたことが私の分子の差別的可能性を確認することができるかどうかは分かりません。彼らがすべて0である理由を理解するために詳細に入るために何かできることはありますか、本当に彼らが私のコホートを層別化できないことを確認するために何か他にもありますか?LASSOの係数はopt1Dを使用して0に等しい

あなたが正則を使用する前に、処罰せずにデータを当てはめる検討しました事前

+0

私はそのパッケージに慣れていませんが、正規化設定の過大さに関係していると思います。境界を高すぎるように設定すると、L1とL2の両方がゼロ(またはゼロに近い)係数を与えます。 –

+0

Davidありがとうございました。しかし、どうすればその境界を手動で設定できますか? – Bfu38

答えて

1

でいただきありがとうございますか! L1の正則化は、当然、有意な数のゼロ係数をもたらす。

私はまずPCA/PCoAを実行し、あなたの遺伝子があなたのクラス変数にしたがって分かれているかどうかを見ます。これにより、時間を節約でき、クラス変数全体で最大の違いを示す遺伝子にデータセットをトリミングできるようになります。また、Rの経験が比較的少ない場合は、Limmaのような線形モデリングパッケージを使用することをお勧めします。これは、優れたドキュメントとそれに従うのが簡単な多くの例があるからです。

+0

私は最近、腫瘍と正常患者の間で自分の遺伝子の分布を調べました。残念なことに、それらは2つのクラスの間に実質的な差異がないという意味が重なります。これがLASSOの係数が0である理由です。 – Bfu38

関連する問題