gds_result.txtを読み込んでdata.frameを取得する方法R

gds_result.txtをRを使ってenter link description here から読み込み、データフレームを取得します。 data.frameには7つの列があります。 data.frameのCOLNAMESは以下の通りであった。gds_result.txtを読み込んでdata.frameを取得する方法R

タイトル2.内容3.生物4. 5.プラットフォーム6. FTPダウンロード7. DataSetに
取得する方法は？

出典

2016-11-07 stata

あなたはこれで始めることができ：

library(tidyverse) 
library(stringr) 

txt<-read_lines("https://raw.githubusercontent.com/juancholkovich/GEO_DataSet_Browser/master/gds_result.txt") 

txt %>% as_data_frame() %>% 
    filter(!value=='') %>% 
    mutate(new_group=as.numeric(str_detect(value, "^(\\d*?\\.)")), 
     group=cumsum(new_group), 
     keyword=str_match(value, "^Organism|^Project|^Type|^FTP|^Sample|^Series|^Source"), 
     keyword=ifelse(str_detect(tolower(value), "^dataset|^series|^sample|^platform|related platforms"), "Dataset", keyword), 
     keyword=ifelse(str_detect(tolower(value), "accession"), "Accession", keyword), 
     keyword=ifelse(new_group==1, "Name", keyword), 
     keyword=ifelse(is.na(keyword), "Comment", keyword) 
) %>% select(-new_group) %>% spread(key=keyword, value=value)

が行われる多くのクリーニングはおそらくありますが、少なくとも、あなたのデータにいくつかの構造を得ます。

出典

2017-07-28 14:07:33 dmi3kno

gds_result.txtを読み込んでdata.frameを取得する方法R

答えて

関連する問題