私の入力は次のようになり、遺伝的データである:/ A(あなたが単一の値を持っている場合は、私たちのすべてが「/」なし2つの対立遺伝子(ママとパパを)持っているので、遺伝学に深く得ることなくすべての可能性をキャッチする正規表現ですか?
SNP VALUE
rs123456 A/G
rs345353 del/CTT
rs343524 T
rs243224 T/del
....
両方の対立遺伝子が同じであることを意味するC/G/T/del/CTT)であり、そうでなければ、それらが異なることを示すスラッシュ「/」がある。
SNPの既知のパターンを見つける必要がありますが、多くの可能性があることを理解しています(/(スラッシュ)値の数が多い場合)。
私はすでに[A|C|G|T|del|CTT]
のような正規表現を構築しています。
A/G = G/Aですので、すべての可能性に合わせる必要があります。
これを行うのに役立つ機能やロジックはありますか?お知らせ下さい。私は2、より多くを持っている場合
rs123 = A/G, rs456 = T/C, rs789 = CTT:
Option 1: A T CTT;
Option 2: A C CTT;
Option 3: G T CTT;
Option 4: G C CTT;
をしかし、/私はすべて取得したい:
予想される出力は、例えば値のすべての可能な変形がある:
PS
の詳細情報を追加オプション。
をあなたが期待される出力を提供してもらえますか?より大きなデータの例を追加することも検討してください。 – missuse
あなたの予想される出力は何ですか?また、すべてのベースをカバーするサンプル入力を提供することができます(これは、あなたが挙げたもののような複数のケースのサンプル入力です)。そうすることで、私たちが適切に援助するのに役立ちます。 – ctwheels
あなたは '/'、次に 'sort'、' paste 'を一緒に分割する必要があると思います。 –