2017-01-07 16 views
0

遺伝子のサブセットにおけるGO項の濃縮を調べるために、超幾何分析(pythonスクリプトを使用)を行った。次のように私の出力の例を示します。Bongeferi、超幾何学的解析からのp値の補正

Column1 = GO ID 
Column2 = Total sum of all terms in the original dataset 
Column3 = Total sum of [Column 1] IDs in the original dataset 
Column4 = Sum of all terms in the subset 
Column5 = Sum of [Column 1] IDs in subset 
Column6 = pvalue derived from hypergeometric test 

私はp値により、実験の数を掛けなければならないことを知っているが、私はデータでこれを行う方法がわからないんだけど

GO00001 1500 300 200 150 5.39198144708e-77 
GO00002 1500 500 400 350 1.18917839281e-160 
GO00003 1500 400 350 320 9.48402847878e-209 
GO00004 1500 100 100 75 3.82935778527e-82 
GO00005 1500 100 80 80 2.67977253966e-114 

私が持っています。サブセットまたは元のデータセットとサブセットの組み合わせから計算していますか?例えば、それは次のようになります。

Column2 * Column5 * pvalue 
Column3 * Column5 * pvalue 
Column4 * Column5 * pvalue 

これは愚かな質問のように思える場合、私は謝るが、私はちょうどそれのまわりで私の頭を取得するように見えることはできません。事前に多くの感謝!

答えて

3
from statsmodels.sandbox.stats.multicomp import multipletests 
p_adjusted = multipletests(Column6, method='bonferroni') 

または私は何かが足りないのです...あなたのコメントの門のため

+0

おかげで、私はどのようにこの作品についてほんの少し困惑している - ?どのようmultipletestsが実行されているどのように多くのテストを知っているのですか?私は理解しようとしているだけで、私は絶望的な初心者です!あなたの助けをもう一度ありがとう:) – Gloom

+0

もちろん、P値の数から。 – Phlya

関連する問題