OK、私は整列して隣接するツリーを作るために興味のあるタンパク質(699個の配列)の数百の断片を持っています。これらのフラグメントは、多くの場合、互いに良好に整列しない(同一または類似のタンパク質の異なる領域)。しかし、全タンパク質配列が定義され、NCBIおよび他のデータベースなどに提出されている。また、これらのタンパク質のための文献で作られた樹木も存在する。私の断片をメタゲノムから取り出し、それを既知の配列に整列させて、それぞれの断片が公開された木のどこにあるのかを定義する方法はありますか? 私の唯一の解決策は、各断片が存在する場所を定義するために(出版物からの元の全タンパク質配列を使用して)予め定義されたツリー上の各配列(または配列のクラスタ)を実行することです。これを行う簡単な方法はありますか?同じタンパク質のフラグメントの系統樹(メタゲノムから)
0
A
答えて
0
よく整列ツールClustalは整列を行い、適切なフラグを立ててツリーを作ることもできます。最大のメタゲノムを含む、すべてのシーケンスを含むfastaファイルを作成すると、私はそれを信じています。アライメントスコアに基づいて系統樹を自動的に生成させることができます。これがあなたが望むものすべてを達成するかどうかは不明ですが、それはスタートです。いくつかの.fastaファイルを作成して、インテリジェントな設計と事前知識を使用して調整して、望ましい結果を得る必要があるかもしれません。
#!/usr/bin/perl
use warnings;
print "Please type the list file name of protein fasta files to align (end the directory path with a/or this will fail!): ";
$directory = <STDIN>;
chomp $directory;
opendir (DIR,$directory) or die $!;
my @file = readdir DIR;
closedir DIR;
my $add="_align.fasta";
foreach $file (@file) {
my $infile = "$directory$file";
(my $fileprefix = $infile) =~ s/\.[^.]+$//;
my $outfile="$fileprefix$add";
system "/Users/Wes/Desktop/eggNOG_files/clustalw-2.1-macosx/clustalw2 -INFILE=$infile -OUTFILE=$outfile -OUTPUT=FASTA -tree";
}
関連する問題
- 1. 系統樹アルゴリズム
- 2. 系統樹用ループ
- 3. phyloxml系統樹の縮合
- 4. 系統樹の比較
- 5. 種のリストから簡単な系統樹樹(樹木)を作る
- 6. BioPythonにおける系統樹のサブツリー
- 7. PPI(タンパク質 - タンパク質相互作用)ファイルから無向グラフを作成する
- 8. d3.jsの新機能この系統樹
- 9. 系統樹に外部データを注釈しますか?
- 10. 系統樹の位置を維持しながらチップラベルでクレードを縮める
- 11. Python ete3 - 系統樹の枝を伸ばす方法はありますか?
- 12. D3の系統樹に指定されたノードの親ノードを取得
- 13. 個体の種によって系統樹の先端を着色する
- 14. 異なる高さクラスタ系統樹iはd3.js について質問があり
- 15. newick文字列形式の距離行列を系統樹に変換する
- 16. タンパク質構造の可視化
- 17. タンパク質コード遺伝子正規表現
- 18. どこから* .mat形式のRS126タンパク質データセットをダウンロードできますか?
- 19. Pythonモジュール樹状突起を使用して系統樹上のノード間のペアワイズ距離を計算すると、ヒントラベルが印刷されますか?
- 20. 同じアクティビティの同じフラグメントのナビゲーション引き出し
- 21. 同じアクティビティと同じ画面の2つのフラグメント
- 22. 同じアクティビティの別のフラグメントのフラグメントアクセスウィジェット
- 23. Rプログラミング:どのように3つの段階で系統樹を切るとテキスト
- 24. サイトスコープのタンパク質の形にネットワークを得るには?
- 25. 同じアクティビティの2つのフラグメント
- 26. 同じフラグメントの複数のViewPager
- 27. 複数のほぼ同じフラグメントに同じアダプターを再使用
- 28. は、私は、このように<code>ggdendro</code>を使用して系統樹を作成
- 29. Biopythonでタンパク質配列のパターンを探す
- 30. 異なるフラグメントの同じフローティングアクションボタン
おそらく、このサポートする必要があります:ここで私はそれがアラインメントおよび系統樹を作る書いたPerlスクリプトですhttp://area51.stackexchange.com/proposals/6729/bioinformaticsは、その間はhttp://scicomp.stackexchange.com/でヘルプを見つけることができます。 – Marcin
おそらく、この質問をするより良い場所は次のとおりです。http://biostar.stackexchange.com/ – PhiS