教育的な例として、海洋生物学コースのための簡単な系統樹を作りたいと思う。 Iは、樹状図(クラスター分析)を取得し、第一の切断点としてドメインを使用したい種のリストから簡単な系統樹樹(樹木)を作る
Group <- c("Benthos","Benthos","Benthos","Benthos","Benthos","Benthos","Zooplankton","Zooplankton","Zooplankton","Zooplankton",
"Zooplankton","Zooplankton","Fish","Fish","Fish","Fish","Fish","Fish","Phytoplankton","Phytoplankton","Phytoplankton","Phytoplankton")
Domain <- rep("Eukaryota", length(Group))
Kingdom <- c(rep("Animalia", 18), rep("Chromalveolata", 4))
Phylum <- c("Annelida","Annelida","Arthropoda","Arthropoda","Porifera","Sipunculida","Arthropoda","Arthropoda","Arthropoda",
"Arthropoda","Echinoidermata","Chorfata","Chordata","Chordata","Chordata","Chordata","Chordata","Chordata","Heterokontophyta",
"Heterokontophyta","Heterokontophyta","Dinoflagellata")
Class <- c("Polychaeta","Polychaeta","Malacostraca","Malacostraca","Demospongiae","NA","Malacostraca","Malacostraca",
"Malacostraca","Maxillopoda","Ophiuroidea","Actinopterygii","Chondrichthyes","Chondrichthyes","Chondrichthyes","Actinopterygii",
"Actinopterygii","Actinopterygii","Bacillariophyceae","Bacillariophyceae","Prymnesiophyceae","NA")
Order <- c("NA","NA","Amphipoda","Cumacea","NA","NA","Amphipoda","Decapoda","Euphausiacea","Calanioda","NA","Gadiformes",
"NA","NA","NA","NA","Gadiformes","Gadiformes","NA","NA","NA","NA")
Species <- c("Nephtys sp.","Nereis sp.","Gammarus sp.","Diastylis sp.","Axinella sp.","Ph. Sipunculida","Themisto abyssorum","Decapod larvae (Zoea)",
"Thysanoessa sp.","Centropages typicus","Ophiuroidea larvae","Gadus morhua eggs/larvae","Etmopterus spinax","Amblyraja radiata",
"Chimaera monstrosa","Clupea harengus","Melanogrammus aeglefinus","Gadus morhua","Thalassiosira sp.","Cylindrotheca closterium",
"Phaeocystis pouchetii","Ph. Dinoflagellata")
dat <- data.frame(Group, Domain, Kingdom, Phylum, Class, Order, Species)
dat
、第としてKindom、第として門などがありません:私は、分類学上のランクの種のリストを持っています値は無視する必要があります(カットポイントなし、代わりに直線)。グループは、ラベルの色分けカテゴリとして使用する必要があります。
このデータフレームから距離行列を作成する方法は少し不明です。 Rのための系統樹のパッケージがたくさんあります、彼らはnewickのデータ/ DNA /その他の高度な情報を望んでいるようです。したがって、これで助けていただければ幸いです。
)=、それが何かを見つけるために一週間かかりR.と作業の流れを示しています。 – Joel
'r-sig-phylo @ r-project.org'でこの質問に役立つかもしれません... –
うーん... plot.hclust()は素敵なプロットを生成します。確かに、このデータセットをhclustオブジェクトに変換する方法が必要ですか? ade4パッケージのplot.phylog(http://pbil.univ-lyon1.fr/ade4/ade4-html/plot.phylog.html)はさらに良いものになりますが、おそらく不可能なこのデータフレームをphylogオブジェクトに変換しています(http: /pbil.univ-lyon1.fr/ade4/ade4-html/phylog.html)? – Mikko