read.tableを使用して多くのテキストファイルをRに読み込もうとしています。ほとんどの場合、定義済みの列を持つクリーンなテキストファイルがあります。R:空白と不等な列数のテキストファイルを読む
私は読んしようとしているデータは、テキストファイルの空白と長さはレポートによって異なることがわかりますftp://ftp.cmegroup.com/delivery_reports/live_cattle_delivery/102317_livecattle.txt
から来ています。 ftp://ftp.cmegroup.com/delivery_reports/live_cattle_delivery/102317_livecattle.txt ftp://ftp.cmegroup.com/delivery_reports/live_cattle_delivery/100917_livecattle.txt
私の目的は、これらのテキストファイルの多くを読み、データセットにそれらを組み合わせることです。
もし私がそれらの1つを読むことができれば、コンパイルは問題ではありません。しかし、テキストファイルの形式のためにいくつかの問題が発生しています。
1)FIRMSの数はレポートによって異なります。たとえば、インポートするデータの行が3行(つまり、そのデータを扱っている3つの企業)であり、時には10が存在することもあります。
2)空白が認識されています。たとえば、FIRMセクションの下にDeliveries(DEL)とReceipts(REC)の列があります。それは、このセクションで読み込まれたデータは、次のようになります。しかし、私はfomattingでこれを読んだとき、すべて台無しにして、ブランク値
3のためにNAを入れていません
df <- data.frame("FIRM_#" = c(407, 685, 800, 905),
"FIRM_NAME" = c("STRAITS FIN LLC", "R.J.O'BRIEN ASSOC", "ROSENTHAL COLLINS LL", "ADM INVESTOR SERVICE"),
"DEL" = c(1,1,15,1), "REC"= c(NA,18,NA,NA))
)上記の問題テキストファイルの「YARDS」と「FUTURE DELIVERIES SCHEDULED」のセクションを適用します。
私はテキストファイルのセクションを読み込み、それに応じてフォーマットしようとしましたが、企業の数が日々変わるのでコードは一般化しません。
ご協力いただければ幸いです。
ありがとうございます。これは大きな助けになりました。すべてのものは、最後のセクションでデータを引き出すことを円滑に期待しています。 0100の数字はレポートからレポートに変わるため、テキストファイル全体でジェンナルライズできません。グラバー機能にファイルの最後に行くように指示する方法はありますか?助けてくれてありがとう – EDennnis
文字ベクトルの最終行、ひいてはテキスト行を得るためには、単純に 'vector [length(vector)]'を使うことができます。代わりに、 'tail(vector、1)'がうまくいくと思います。 –
未解決の問題がまだ残っている場合は、正しく機能しなかったものを指定して、失敗したコードを入力してください。これにより、簡単に手助けすることができます(データの解析はケース固有のタスクです。可能な限り正確にコード内のクリティカルポイント)。それ以外の場合は、回答に感謝してください。 –