は(私はそれが存在していないアイデアを持っていたあなたの助けとのreadLine機能を示唆両方ありがとう)上記のコードは実際に私が望んでいた出力を生成しませんでしたが、自分のコードを修正して自分自身のものを書くことができました。私はRに新しく、一般的にコーディングするので、おそらく最も洗練されたコードではないかもしれませんが、それは仕事を終えました。ここにあります:
con<- file("blast5.txt", open = "r")
## Calculate rows and column needed
l<-0; w<-0; i<-0
while (length(line <- readLines(con, n=1, warn = FALSE)) > 0) {
if (grepl("Query", line)==TRUE){
l=l+1
if (i>w){
w<-i
}
i<-0
}
else if (grepl(">", line)==TRUE){ # COUNT RESULTS UNDER EACH QUERY
i<-i+1
}
}
# Make an empty array to store the data
blast<- array(NA,c(l,w+1))
close(con)
i<- 0; j<-1
con<- file("blast5.txt", open = "r")
while (length(line <- readLines(con, n=1, warn = FALSE)) > 0) {
if (grepl("Query", line)==TRUE){
i=i+1
j<-1
blast[i,1] <- line #STORE QUERY NAME IN FIRST COLUMN
}
else if (grepl(">", line)==TRUE){
j<-j+1
blast[i,j]<- line #STORE RESULTS IN SEPARATE COLUMNS
}
}
close(con)
*爆発出力*とは何ですか?どのような形式の-txt? Rタイプ - ベクトル、リスト、データフレーム? – Parfait
申し訳ありませんが、爆発の部分は重要ではなく、データベースからタンパク質を同定するプログラムです。出力は、上記のように1列と〜40,000行のテキストファイルです。私は、単一のクエリで特定された異なるタンパク質を集計したいだけです。私は必ずしもRを使用する必要はありませんが、それを行う方法を知るために役立つでしょう –