sequence-alignment

    3

    2答えて

    私はNeedleman-Wunschアルゴリズム(ヌクレオチド/タンパク質配列のアライメントに通常使用される)の結果をどのように定量化できるか疑問に思っています。 いくつかの固定スコアリングスキームと、可変長の2つのシーケンスS1とS2を考えてみましょう。 S1とS2の可能なすべてのアライメントをブルートフォースで計算し、スコアリングアライメントの最高値がxであるとします。もちろん、これはNeed

    0

    2答えて

    文字列のリストがより大きな文字列に最もよく揃うインデックスを与える関数が必要です。例えば : text = 'Kir4.3 is a inwardly-rectifying potassium channel. Dextran-sulfate is useful in glucose-mediated channels.' と文字列のリスト:文字列が与えられ tok = ['Kir4.3',

    4

    2答えて

    OK、これは私が何をしたいです: 以上の2つの文字列を取得し、それらを「合わせる」(無DNA/RNA配列またはそれらの各1000個のアイテムのようではないとのような、普通の文字列) 私は既にペアワイズアラインメント(2つのストリングのアライメント)を行ってきましたが、2つ以上のペアをアライメントしようとすると「ギャップ」が私にいくつかの問題を引き起こします。 例(1私は現在テストしています): A

    0

    1答えて

    私は最適な方法で2つのDNA配列をアライメントしたいと思っていますが、Lが3の倍数であればペナルティはある定数a。 Lが3の倍数でない場合、ペナルティはいくつかの定数bに対してb * Lです。 私はO(n * m)アルゴリズムを設計することになっています。ここで、nとmは最適な配列を見つけるDNA配列の長さです。しかし、これについての難しい部分は、私が拡大しているギャップの大きさを把握しなければな

    2

    1答えて

    初めてbiopythonを使用しています。これが基本的な質問であれば私を許してください。 私はシーケンスを入力し、それらを整列させ、元のシーケンス(ungapped)と整列されたシーケンス(gapped)のインデックス位置を参照できるようにしたいと思います。 私の実際の世界の例はエノラーゼ(Uniprot P37869およびP0A6P9)です。基質結合リジンは、大腸菌では392、枯草菌では389で

    1

    1答えて

    これは簡単なことですが、私は非常に限られたバイオインフォマティクス経験を持っています。 私は同じ12種の異なる遺伝子のアライメントを含む多くの-100,000-FASTAファイルを持っています。各ファイルには、次のようなものになります。同じように命じている >dmel ACTTTTGATACAATTAAC >dsim AATCCCAGACAAATTAAG >dsec AGTTTTGCAA

    0

    1答えて

    それらが整列し、同じ長さを有しているように、私は、次のようにfinddelay使用してオーディオ信号の対をトリム/(同じ周波数)をクリップすることができる午前: d12 = finddelay(s1,s2); if(d12 < 1) start1 = -d12+1; start2 = 1; end1 = length(s1); end2 = min(len

    1

    2答えて

    タイトルとして、私は時系列のアライメントに取り組んでおり、アライメント結果の視覚化が望まれます。 この目的のために、私は、アライメントアルゴリズムによって生成された「アンカーポイント」を結ぶ線を描きたいと思います。例で np.random.seed(5) x = np.random.rand(10) # time-series 1 y = np.random.rand(20) # time

    1

    1答えて

    私は13塩基から120塩基あり、保存された領域、それらの間の平均発散または非常に発散する異常値を見つけるためにそれらを比較したい。 問題は、この数のシーケンスで試したことは実行できないということです。 だから誰もこのサイズで似たようなことをしてくれましたし、それを達成するためのヒントをいくつか教えていただけますか?または、私が探すべきちょっとしたヒントでしょうか?

    8

    1答えて

    アフィンギャップペナルティ関数を使用したローカル配列アライメントのSmith-Watermanアルゴリズムを実装しようとしています。私はアラインメントスコアの計算に必要な行列をどのように開始して計算するのかを理解していると思いますが、アラインメントを見つけるためにトレースバックをどのように行うのかはわかりません。私はトレースバックのための単一の行列を必要とする、またはちょうど1ならば、私は次のコー