fasta

    1

    1答えて

    現在、リファレンスゲノムを使用して読み込みをマップするために.fastaファイルをbwaにインポートしようとしています。しかし、私は現在、このエラーが発生しています: [E::bwa_idx_load_from_disk] fail to locate the index files ヘルプがありますか?ここに私のコードは次のとおりです。 #!/bin/bash source /opt/a

    0

    2答えて

    私はBiopythonで作業しようとしていました。私のコード: fasta_string = open("C:\\Users\\saeed\\Desktop\\dna2.fasta").read() print('1') result_handle = NCBIWWW.qblast("blastn", "nt", fasta_string) print('2') blast_recor

    0

    1答えて

    私のテストは次のようになります:私は、 '>'によって導入された1行のヘッダーを持ついくつかのテキスト部分を持っています。ヘッダーに表示されるテキストの種類は明確ではなく、単なる1行であることは明らかです。 ヘッダーの後のテキスト部分の長さが変わる可能性があります。また、テキスト部分1と2(以下を参照)の間に示されているように、間に空白行があるかもしれません。また、テキスト部分の数は可変である。

    0

    3答えて

    私のフォルダにはたくさんのTSVファイルがあります。その中の誰もが、私はfastaファイルを取得したいのですが、 '>'記号の後のヘッダはファイルの名前です。したがって :呼ば 入力ファイル: "A.fasta" と呼ばれる "A.coseq.table_headless.tsv" HIV1B-pol-seed 15 MAX 1959 GTAACAGACTCACAATATGCATTAGGAATCA

    0

    1答えて

    私はコンピュータスキルが0の生物学者ですが、大規模なDNA配列をBLAST検索のためのより小さい.fastaに分割する簡単なスクリプトが必要です。私は無駄な答えを見つけるためにこのサイトを数日間閲覧してきました。私はbiopython cookbookから自分のコードをかなりコピーしました。なぜこれは機能しないのですか?特に def batch_iterator(iterator, batch_s

    1

    2答えて

    これはStack Overflowに関する私の最初の質問ですので、私の質問が正しくフォーマットされていない場合、まず謝りたいと思います。私はコーディングに関して特に経験はありませんが、私の仕事で特定の問題を解決しようとしています。 (DNA配列のアライメントに使用される)大きなファーストファイルのヘッダーを置き換えようとしています。私はこのような内容を有するFASTAアライメント(alignmen

    4

    1答えて

    こんにちは、 を、すべての繰り返し4量体(すなわち、すべてを識別4マーを複数回出現させる)を繰り返し、4マーとそれが見出された配列のヘッダーをプリントアウトする。 k-merは、単にkヌクレオチドの配列である(例えば、「aaca」、「gacg」および「tttt」は4量体である)。私は2つの要求を持っている use strict; use warnings; my $count = -1;

    0

    1答えて

    awkと同じパターンを見つけて、ファイルの末尾にファイルが何回存在するかを示します。 Spiroplasma_culicicolaが7回発生した場合、私はこのようになりますFASTAファイルを持っているしかしたとえば、[次へ最初に出現する、それが次の第3の発生Spiroplasma_culicicola_3などなど の隣に2回目の出現Spiroplasma_culicicola_2に、Spirop

    -1

    2答えて

    私は2000000文字列[行]までのシーケンス文字列を含むFASTAファイルを持っています。私は小さなサイズでうまくいくコードを書いたが、ファイルのサイズが大きくなるとそれは遅くなる(ファイルの速度が遅くなっても遅くなる)。私は、ファイルサイズが1万の場合に非常に効率的に実行される最初の反復でも、100,000であると考える理由は混乱しています。 例:私は繰り返しごとにprintf文を置く。 10