タブ区切りファイル(ヘッダーなし)から2つのpython3辞書を作成します。このファイルには、group_idとgene_idの2つの列があります。グループは複数の遺伝子を有し、遺伝子は複数のグループに属することができる。私は簡単な例で私が欲しいものを示します。1:1以外のタブ区切りファイルからPython辞書を作成する
group_id gene_id
A a
A b
A c
A d
B a
B c
B e
私は2つの辞書がしたい:私のファイルは2.5 GB単位であり、私がするので
dict1 = {'A':(a,b,c,d),'B':(a,c,e)}
と
dict2 = {'a':(A,B), 'b':(A), 'c':(A,B), 'd':(A), 'e':(B)}
を私はスピードのためのタプルの値を保存したいと思います私は後で一緒に作業しなければならない大きな辞書で終わる。
私はこのような質問がたくさんあることは知っていますが、キーと値のペアを持つファイルを処理するときには答えが見つかりません。
ありがとうございます!
確かに。これをまだ実装しようとしましたか?あなたのコードを見て、あなたがどれだけ遠くにいるのか、そしてあなたが抱えている困難を知ることは素晴らしいでしょう。 – idjaw
パンダは始めるのに適しています。 –
タプルの代わりに値をリストにすることはできますか? – wwii