引用符と引用符を混ぜ合わせて、読み込みしようとするとRの問題が発生するCSVファイルがあります。引用符内のコンマで問題が発生しますが、引用符で区切りますが、無視してください。 ExcelでCSVを表示すると、完全に管理され、どこで破損するかを理解します。これらの設定をRに表示/変換する方法はありますか?ExcelはCSVファイルの読み込みにどのようなパラメータを使用し、どのようにRに適合させることができますか?
問題のファイルをダウンロードするのはlinkです。これは、遺伝子オントロジーとその関連用語のセット、およびその遺伝子がその一部であるかどうか(0または1)です。テキストは4列、pValuesは1列、0/1は50列でなければなりません。
read.table(file, quote="\"", sep=",", row.names=NULL)
でRに読み込もうとしましたが、カテゴリ、名前、冗長IDの値がpValueにこぼれてしまい、カウントデータに影響します。次に、別の誤解した区切り文字が出現するまで、データの全行を1つのセルに入れることができます。
最後に、0/1の最後の列の一部が長さのために編集された問題行があります。
"Pubmed","Expression of epidermal growth factors, erbBs, in the nasal mucosa of patients with chronic hypertrophic rhinitis.","22327010","pubmed_22327010_Expression_of_epidermal_growth_factors,_erbBs,_i...",0.005837270080633278,0,0,0,0,0,1,0,...
私はリンクをたどったが、それはすぐには(サイトに使用されていない人のために)あなたがここで説明するCSVを取得する方法...) –