Biopython(Entrez)を、受託番号(GI *ではない)を返す検索条件で使用しようとしています。ここでBiopythonで検索用語を使用して受託番号を返す
私のコードの小さな抜粋です。
from Bio import Entrez
Entrez.email = 'myemailaddress'
search_phrase = 'Escherichia coli[organism]) AND (complete genome[keyword])'
handle = Entrez.esearch(db='nuccore', term=search_phrase, retmax=100, rettype='acc', retmode='text')
result = Entrez.read(handle)
handle.close()
gi_numbers = result['IdList']
print(gi_numbers)
'745369752'、 '910228862'、 '187736741'、 '802098270'、 '802098269'、 '802098267'、 '387610477' 「544579032」、「544574430」、「215485161」、「 」、「387823261」、「387605479」、「641687520」、「641682562」、 「594009615」、「557270520」、「313848522」、「309700213」、 、 '284919779'、 、 '544345556'、 '544340954'、 '144661'、 '51773702'、 '202957457'、 '202957451'、 '172051323'、
、
私はGIからアクセッションに変換できると確信していますが、追加の手順を避けるといいですね。どのような魔法の断片が欠けていますか?
ありがとうございます。
* NCBIは、NCBIのウェブサイトでdocs for esearch
てみると、使用可能な唯一の2 rettype
のあるGI番号に
私は欠けていたパラメータがあったに違いないと思っていましたが、あなたのアプローチは確かに受け入れやすい方法です。それは完璧に働いています - どうもありがとうございます。 – cer
@cer助けて嬉しいです。あなたは 'esearch'を使ってアクセスIDを返す方法があると思うので、私はドキュメントとグーグルを調べるのに多くの時間を費やしましたが、何も見つかりませんでした。私はあなたの目的のためにこれがうまくいきました。 – MattDMo