-1
[ここにリンクの説明を入力します]あなたがデータをダウンロードすることができ、そこから、[1]添付ファイルのリンクからmovies.datファイルをRにインポートするにはどうすればよいですか?
リンク:http://grouplens.org/datasets/movielens/1m/
[ここにリンクの説明を入力します]あなたがデータをダウンロードすることができ、そこから、[1]添付ファイルのリンクからmovies.datファイルをRにインポートするにはどうすればよいですか?
リンク:http://grouplens.org/datasets/movielens/1m/
movies.datはreadmeファイルで説明したようにようdelimを::
を持つだけでtxtファイルです。あなたを与える
txt <- readLines("./ml-1m/movies.dat", encoding = "latin1")
txt_split <- lapply(strsplit(txt, "::"), function(x) as.data.frame(t(x), stringsAsFactors=FALSE))
dat <- do.call(rbind, txt_split)
names(dat) <- c("MovieID", "Title", "Genres")
dim(dat) # 3883 3
:
dim(dat) # 3883 3
head(dat)
MovieID Title Genres
1 1 Toy Story (1995) Animation|Children's|Comedy
2 2 Jumanji (1995) Adventure|Children's|Fantasy
3 3 Grumpier Old Men (1995) Comedy|Romance
4 4 Waiting to Exhale (1995) Comedy|Drama
5 5 Father of the Bride Part II (1995) Comedy
6 6 Heat (1995) Action|Crime|Thriller
PS:私は彼らとread.table
、readr::read_delim
とdata.table::fread
のような "標準" R-読みメソッドを使用する方法を見つけ出すcouldntのだから、次の操作を行うことができます1バイトの分離が必要です。たとえば::
を他のものに切り替えることができます。 sed CLI