2017-11-26 17 views
0

私はバイオインフォマティクスのコースをやっています。スコアマトリックスからの隠れマルコフモデル

Imは、位置特定確率行列(PSPM)から隠れマルコフモデル(HMM)をモデル化する方法を理解しようとしています。

どのようにモデル化すればよいか明確なパターンはありますか? PSPMに基づいて3つ以上の州でそれをモデル化する方法を教えてもらえますか?

私はPSPMの例を提供しますが、あなた自身で自由に使用することができます。

PSPM例はMITコースから取られました。

+0

あなたがしたいことは本当にはっきりしません。排出確率として与えられた確率で、各位置を状態として冷たいモデルにします。しかし、このようなモデルでは、状態間の遷移確率は「1」になる。したがって、状態は隠されません。 このパターン/モチーフの出現をより長いシーケンスで特定しますか?それからあなたはまた、 "外のモチーフ"の状態を持っていて、その状態のためのいくつかの排出問題を仮定しなければなりません。 – cnettel

+0

@cnettelタスクからの質問は次のようなものです:TF TFのためのTFBS のゼロ、1つまたはいくつかを含むことができるDNA配列をモデル化するHMMの設計あなたの答えは状態と遷移のグラフィカルな表現HMMを構成する。私は、それを隠れマルコフモデルとしてではなく、通常のマルコフ連鎖としてモデル化する方法を知っています。 – Abdiabdisson

答えて

1

質問はあまり明確ではありませんが、これが役に立ちます。

このモデルでは、原則として必要な数だけポジションを設定できます。

ここtherwは、バイオインフォマティクスに行うためのpossilbeあるものの例である:

は、あなたが(私たちは、「データベース」、それを呼び出すことができます)DNAの配列を持っている想像してみましょう。あなたはhmmerで、このようなモデルを構築することができます。

hmmbuild <hmm_profile> <alignment> 

を次にあなたがすべてのアラインメントの各位置のための遷移確率とも遷移確率が含まれていますhmmer_profileを確認することができます。

その後、新しい配列を検索することができます。今、あなたは、ファイル内のシーケンス(「クエリ」)のセットを持っている想像して、あなたは、各クエリが良く揃えた位置を知っているので、あなたの「データベース」に対してそれらをマップしたい:それは返す

nhmmer -o <output_file> --dna <hmmer_profile> <sequences_file> 

output_fileはデータベースに対して配列を整列させる。

関連する問題