2017-09-25 20 views
0

私はバイオインフォマティクスのパイプラインを作成するためにsnakemakeを使いたいと思っていましたが、私はそれをgoogledしてドキュメントやその他のものを読んでいましたが、それでも動作する方法はまだ分かりません。Snakemakeのルール

生データファイルのいくつかを以下に示します。

RAWDATA/010_0_bua_1.fq.gz、RAWDATA/010_0_bua_2.fq.gz
RAWDATA/11_15_ap_1.fq.gz、RAWDATA/11_15_ap_2.fq.gz

...彼らはすべてのファイルを対になっています。)

は、ここに私のalign.snakemake

from os.path import join 


STAR_INDEX = "/app/ref/ensembl/human/idx/" 
SAMPLE_DIR = "Rawdata" 
SAMPLES, = glob_wildcards(SAMPLE_DIR + "/{sample}_1.fq.gz") 

R1 = '{sample}_1.fq.gz' 
R2 = '{sample}_2.fq.gz' 


rule alignment: 
    input: 
     r1 = join(SAMPLE_DIR, R1), 
     r2 = join(SAMPLE_DIR, R2), 
    params: 
     STAR_INDEX = STAR_INDEX 
    output: 
     "Align/{sample}.bam" 
    message: 
     "--- mapping STAR---" 
    shell:""" 
     mkdir -p Align/{wildcards.sample} 
     STAR --genomeDir {params.STAR_INDEX} --readFilesCommand zcat --readFilesIn {input.r1} {input.r2} --outFileNamePrefix Align/{wildcards.sample}/log 
""" 

これがそれです。私はこのファイルを "snakemake -np -s align.snakemake"で実行しますが、このエラーが出ます。

WorkflowError: 対象ルールにはワイルドカードを使用できません。具体的なファイルやルールをワイルドカードなしで指定してください。

私はこの質問をして申し訳ありませんが、それをかなりよく使用している多くの人がいます。どんな援助も本当にうまくいくでしょう。私の英語には申し訳ありません。

P.S.私は公式の文書とチュートリアルを読んだが、まだ分かりません。

答えて

1

ああしました。ここで私の質問への私の答えは、何人かの助けが必要な人がいるかもしれないからです。

from os.path import join 


STAR_INDEX = "/app/ref/ensembl/human/idx/" 
SAMPLE_DIR = "Rawdata" 
SAMPLES, = glob_wildcards(SAMPLE_DIR + "/{sample}_1.fq.gz") 

R1 = '{sample}_1.fq.gz' 
R2 = '{sample}_2.fq.gz' 


rule all: 
    input: 
     expand("Align/{sample}/Aligned.toTranscriptome.out.bam", sample=SAMPLES) 

rule alignment: 
    input: 
     r1 = join(SAMPLE_DIR, R1), 
     r2 = join(SAMPLE_DIR, R2) 
    params: 
     STAR_INDEX = STAR_INDEX 
    output: 
     "Align/{sample}/Aligned.toTranscriptome.out.bam" 
    threads: 
     8 
    message: 
     "--- Mapping STAR---" 
    shell:""" 
     mkdir -p Align/{wildcards.sample} 
     STAR --genomeDir {params.STAR_INDEX} --outSAMunmapped Within --outFilterType BySJout --outSAMattributes NH HI AS NM MD --outFilterMultimapNmax 20 --outFilterMismatchNmax 999 --outFilterMismatchNoverLmax 0.04 --alignIntronMin 20 --alignIntronMax 1000000 --alignMatesGapMax 1000000 --alignSJoverhangMin 8 --alignSJDBoverhangMin 1 --sjdbScore 1 --runThreadN {threads} --genomeLoad NoSharedMemory --outSAMtype BAM Unsorted --quantMode TranscriptomeSAM --outSAMheaderHD \@HD VN:1.4 SO:unsorted --readFilesCommand zcat --readFilesIn {input.r1} {input.r2} --outFileNamePrefix Align/{wildcards.sample}/log 
""" 
関連する問題