2017-11-29 3 views
2

私は1つの変数として表示されるCSVファイルを持っています。私はそれを6に分割したいと思います。私は助けが必要です。1つの変数データフレームを分割する

str(nyt_data) 
'data.frame': 3104 obs. of 1 variable: 
$ Article_ID.Date.Title.Subject.Topic.Code: Factor w/ 3104 levels "16833;7-Dec-03;Ruse in Toyland: Chinese Workers' Hidden Woe;Chinese Workers Hide Woes for American Inspectors;5",..: 2420 2421 2422 2423 2424 2425 2426 2427 2428 2429 ... 

nyt_data$Article_ID.Date.Title.Subject.Topic.Code 

上記のコード行の後にずれた結果は次のとおりです。

> head(nyt_data$Article_ID.Date.Title.Subject.Topic.Code) 
[1] 41246;1-Jan-96;Nation's Smaller Jails Struggle To Cope With Surge in Inmates;Jails overwhelmed with hardened criminals;12                   
[2] 41257;2-Jan-96;FEDERAL IMPASSE SADDLING STATES WITH INDECISION;Federal budget impasse affect on states;20                       
[3] 41268;3-Jan-96;Long, Costly Prelude Does Little To Alter Plot of Presidential Race;Contenders for 1996 Presedential elections;20 

6つの別々の列Article_IDDateTitleSubjectTopicCodeにこれらを分割するためのコードで私を助けてください。

+0

それは、 "カンマ区切り値" CSVは、特別な区切り文字を使用していません。下のモンホークあたり。 – nckbrz

答えて

2

データは ";"で分割されます。 read.csvのデフォルトは "、"です。次のように入力してください:

df <- read.csv(data, sep = ";") 
+0

このコードを使用した後にエラーが発生しました:nyt_data < - read_csv( "nyt_data.csv"、sep = ";") read_csv( "nyt_data.csv"、sep = ";")のエラー: 未使用の引数= ";") > – Instructius

+0

問題は、colnamesヘッダーがドットで区切られているためです。私はcsvファイルに行ってドットを変更しました。コードを使用して、コロン名をインポートして区切ります。しかし、やはりすべてのデータがそれに応じてコロンネームに分離されるわけではありません。いくつかの行は、最初の列にのみ落ちました。あなたはその理由を知っていますか? – Instructius

+0

分割しなかった行の例を投稿できますか?また、分割されていない行の前後に行をポストします。 – leeum

2

カスタムsepでCSVファイルを読んでください。このよう

data <- read.csv(input_file, sep=';') 
+0

私もこれを試しました。しかし、すべての行が正しく分割されたわけではありません。なぜあなたは知っていますか?提案ありがとう – Instructius

+0

@Instructiusどの行が間違っているかを表示できますか?カスタムの 'quote'と' dec'パラメータが必要かもしれません。 – m0nhawk

関連する問題