2011-04-21 1 views
0

BCBio GFFパーサーを使用してGFFファイルを解析しようとしていますが、次のエラーが発生します。誰でもこの問題を解決するのに私を助けることができますか?BCBioのGFFパーサーの問題

トレースバック(最新の呼び出しの最後の):ここでは

File "gff_parse.py", line 6, in <module> 
    for rec in GFF.parse(in_handle): 
    File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 709, in parse 
    File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 299, in parse_in_parts 
    File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 320, in parse_simple 
    File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 603, in _gff_process 
    File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 634, in _lines_to_out_info 
    File "build/bdist.linux-x86_64/egg/BCBio/GFF/GFFParser.py", line 183, in _gff_line_map 
ValueError: invalid literal for int() with base 10: 'New Start' 

が私のコードです:

from BCBio import GFF  
in_file = "infile.gff"  
in_handle = open(in_file) 
for rec in GFF.parse(in_handle): 
    print rec 
in_handle.close() 

おかげ Tulika

答えて

2

はどのようにGFFファイルを生成したのですか?少なくとも1つの無効な行が含まれているようです。 4番目の列は、フィーチャの開始座標の整数を含む必要があります。エラーメッセージには、代わりに値 'New Start'が含まれていることが示されます。

GFF3 specification pageには有効なGFFの例がいくつかあり、online validatorはこのような書式設定の問題のデバッグに役立ちます。