私は2つの列を持つテキストファイルを持っています。列の1つに次のようなデータがあります。TC012950_CDS_3428_4122
最初の番号はTC#、2番目のCDS、3番目の開始位置、4番目の終了位置です。 5582 mRNAの3428 protein_codingデータを分割してデータを追加し、一緒に復習します
ChLG10:11.93631
が、私はタブで分割染色体情報が含まれている別のテキストファイルを持っている: 他の列には、このような一つの値を持っています。 - 。まだ元の値を含む第二の柱で TC012950_ChLG10_3428_4122
:TC012950
私の包括的な目標は、それがどのように見えるので、最終的には最初のファイルの列に染色体名(ChLG10)を内蔵することです。
データを配列やデータフレームに入れようとしましたが、最初の列を分割するのが苦労します。私は交換に0行などがあると言うエラーが出てくる。したがって、私はここにいる誰かが正しい方向に私を向けることができたと思っていました。
_最初の列を複数の列に分割するにはどうすればよいですか?おそらくそれらをタブに分割する方法はありますか? その後、Chr Location列をTC#とCDS列の間に置くことができるように、各行を他のデータの対応する行に一致させる必要があります。それが正しい場所に置かれたら、すべての列を一緒に結合し、_で区切る必要があります。私はタブで何かをしたら、そのタブを再び_に置き換えようと思っていますか?アドバイスや助けを歓迎します。あまり前もってありがとう!
あなた何をやっての無限の方法があります。しかし、我々はいくつかのデータが必要です。 – Abdou