1
私は開いているデータセットを使用しています。特に私はこのデータセットを使用しています:http://files.grouplens.org/datasets/movielens/ml-100k/u.item。python - 開いているデータセットで無駄なデータを取り除く方法
私は開いているデータセットを使用しています。特に私はこのデータセットを使用しています:http://files.grouplens.org/datasets/movielens/ml-100k/u.item。python - 開いているデータセットで無駄なデータを取り除く方法
あなたを:私は
movies.head()
を実行しようとすると
movie_cols = ['movie_id', 'title','release_date','imdb_url']
movies = pd.read_csv('http://files.grouplens.org/datasets/movielens/ml-100k/u.item',sep='|',names=movie_cols)
それはこの示しています。私は、私のようなパンダにそれをロードする際に、データセットを解析しようとしていますフィルタのためのパラメータusecols
1., 2., 3. and 5.
機能の列read_csv
:
movie_cols = ['movie_id', 'title', 'release_date', 'imdb_url']
movies = pd.read_csv('http://files.grouplens.org/datasets/movielens/ml-100k/u.item',
sep='|',
names=movie_cols,
encoding='latin-1',
usecols = [0,1,2,4])
print (movies.head())
movie_id title release_date \
0 1 Toy Story (1995) 01-Jan-1995
1 2 GoldenEye (1995) 01-Jan-1995
2 3 Four Rooms (1995) 01-Jan-1995
3 4 Get Shorty (1995) 01-Jan-1995
4 5 Copycat (1995) 01-Jan-1995
imdb_url
0 http://us.imdb.com/M/title-exact?Toy%20Story%2...
1 http://us.imdb.com/M/title-exact?GoldenEye%20(...
2 http://us.imdb.com/M/title-exact?Four%20Rooms%...
3 http://us.imdb.com/M/title-exact?Get%20Shorty%...
4 http://us.imdb.com/M/title-exact?Copycat%20(1995)