2012-03-09 10 views
0

データセットには14個の列を含める必要がありますが、Rに読み込むと2個の列として表示され、後者の列は1個として表示され、 "。 "R以外の列を分割する方法

Iは、使用して読み取る:

をDAT < - read.tableを( "/data/GER.female.RAWMACH"、ヘッダ= F、9月= "\ tの")

ヘッド(DAT)

:私は出力を提供している下に0 V1
形質
CASE
CASE
CASE
CASE
CASE
CASE .......... ALLELES..FREQ1 .... RSQR

V2 MARKER。 ..EFFECT1..OR ...... STDERR..​​WALDCHISQ.PVALUE ..... LRCHISQ.LRPVAL.NCASES.NCONTROLS
rs7 TA .9104 .0001 -3.944 0.019 19.634 0.0403 0.8408 0.0403 0.8409 260 446

RS6 AC 0.9114 0.0002 -2.552 0.078 14.349 0.0316 0.8589 0.0316 0.8589 260 446

RS9 CT 0.8444 0.0001 2.772 15.985 15.076 0.0338 0.8541 0.0338 0.8542 260 446

RS5 GA 0.9164 0.0001 0.025 -3.683 18.039 0.0417 0.8382 0.0417 0.8383

RS2 TC 0.5168 0.0001 -2.466 0.085 10.811 0.0520 0.8229 0.0002 -1.727 0.178 12.241 0.0199 0.8878 0.0199 0.8878 260 446

.8195 0.0520 0.8196 260 446

RS1 TG

私はいくつかのことを試みました(テーブルを書き直し、colsplit)、成功しませんでした。私は何が欠けていますか?

ありがとうございます。

+0

データを読み込むために使用しているコードと、元のデータの外観を見せて、フォーマットに細心の注意を払う必要があります。 – joran

+0

よろしくお願いします。私はサイトの初心者ですが、テキストエディタのツールバーが見つかったので、フォーマットを失うことなくコードを投稿できます。非常に便利。 – mfk534

答えて

1

あなたはタブで区切られたファイルを持っていると思っていましたが、そうではありませんでした。ヘッダーもあります。 sep="\t"を削除し、header=TRUEを設定してデフォルトの空白区切り文字を使用してください。

+0

ありがとう!私が今問題を抱えているのは、実際のデータがタブで区切られていることです(また値が欠落しています)。ヘッダーは単に "。"で区切られています。したがって、コードからsep = "\ t"を削除した場合、スキャンでエラーが発生します。スキャンのエラー(ファイル、what、nmax、sep、dec、quote、skip、nlines、na.strings、: 行233669 – mfk534

+1

'readLines'で最初の行を読んで、必要に応じて分割し、' input < - read.table'と 'skip = 1'を使い、次に' names(input)< -' ...処理されたヘッダーベクトル –

+0

私はreadLinesに慣れていませんでした。それは良いリソースです。ありがとうございます!私は私の問題を解決しました:dat < - read.delim(file = "/ data/GER。 female.RawMach2 "、header = F、sep =" ") – mfk534

0

これ以上の情報がなければ、確かに言い表せませんが、これを解決する最善の方法は、まずテーブルを適切に読み込むことであると確信しています。ロードしているデータの実際の構造が、あなたが得ている形になっていない限り、間違ってロードしています。 read.tableのドキュメントと関連する方法、特にsepheaderの引数を参照してください。私はこれを推測して、事後クリーンアップを必要とせずにデータインポートの問題を解決します。

関連する問題