python - 開いているデータセットで無駄なデータを取り除く方法

あなたを：私は

movies.head()

を実行しようとすると

movie_cols = ['movie_id', 'title','release_date','imdb_url'] 
movies = pd.read_csv('http://files.grouplens.org/datasets/movielens/ml-100k/u.item',sep='|',names=movie_cols)

それはこの示しています。私は、私のようなパンダにそれをロードする際に、データセットを解析しようとしていますフィルタのためのパラメータusecols1., 2., 3. and 5.機能の列read_csv：

movie_cols = ['movie_id', 'title', 'release_date', 'imdb_url'] 
movies = pd.read_csv('http://files.grouplens.org/datasets/movielens/ml-100k/u.item', 
        sep='|', 
        names=movie_cols, 
        encoding='latin-1', 
        usecols = [0,1,2,4]) 
print (movies.head()) 
    movie_id    title release_date \ 
0   1 Toy Story (1995) 01-Jan-1995 
1   2 GoldenEye (1995) 01-Jan-1995 
2   3 Four Rooms (1995) 01-Jan-1995 
3   4 Get Shorty (1995) 01-Jan-1995 
4   5  Copycat (1995) 01-Jan-1995 

              imdb_url 
0 http://us.imdb.com/M/title-exact?Toy%20Story%2... 
1 http://us.imdb.com/M/title-exact?GoldenEye%20(... 
2 http://us.imdb.com/M/title-exact?Four%20Rooms%... 
3 http://us.imdb.com/M/title-exact?Get%20Shorty%... 
4 http://us.imdb.com/M/title-exact?Copycat%20(1995)

出典

2017-07-12 04:25:06 jezrael

python - 開いているデータセットで無駄なデータを取り除く方法

答えて

関連する問題