2017-12-14 4 views
0

Panadasを使ってJupyterノートにcsvファイルを読み込もうとしています。私は列をファイルし、インデックスを読んだとき、私は([」< '!DOCTYPEのHTML>']、DTYPE = 'オブジェクト')私はなぜ私のcsvがhtmlのdoctypeとして読み込まれているのか理解できる人がいますか?

インデックスを読み込み、メッセージが表示されますどうして私のファイルがhtmlのdoctypeとして読み込まれているのかわかりませんし、その中のどのカラムも現在のフォーマットで読むことができません。ファイルをExcelに変換するとエラーが表示されます。誰かが問題の可能性について正しい方向に向けることができますか?ありがとうございました。

import numpy as np 
import pandas as pd 

inspection = pd.read_csv("http://localhost:8889/view/Desktop/python/Data/Inspections_MergedFile.csv", sep='\t') 

inspection.columns 

CSVデータは、レストランの検査にNYCのオープンデータファイルから取得されます。https://data.cityofnewyork.us/Health/DOHMH-New-York-City-Restaurant-Inspection-Results/xx67-kt59食中毒https://data.cityofnewyork.us/Social-Services/food-poisoning/gjkf-etq5に311のデータと結合されました。

+1

csvからサンプルを貼り付けることはできますか? – user1721713

+1

そのウェブページに「エクスポート」ボタンが表示されます。このボタンをクリックすると、「CSV」ボタンが表示されます。私はあなたがしたことではないと推測しています... – JohnE

答えて

1

ウェブAPIを使用してファイルをローカルに配信する場合は、アプリに関する詳細情報とレイアウトの構成情報を提供する必要があります。

私はあなたが提供するリンクをオフに、次のCSV形式のための彼らのエクスポート・オプションのためのリンクをコピーしようとすると、私は(最終的には、数分後に)ダウンロードしたデータを取得し、警告とはいえ...

>>> df = pandas.read_csv('https://data.cityofnewyork.us/api/views/xx67-kt59/rows.csv') 
sys:1: DtypeWarning: Columns (6) have mixed types. Specify dtype option on import or set low_memory=False. 
>>> df 
      CAMIS        DBA   BORO BUILDING \ 
0  41471806      THE HEN HOUSE  BROOKLYN  7302 
1  50060020     CURRY EXPRESS NY  MANHATTAN  130 
2  50060627   RED HOUSE ASIAN FUSION   QUEENS 19203 
3  50040866      FUEL GRILL  MANHATTAN  112 
4  41710571      BLACKTHORN 51   QUEENS  8012 
5  50015486      THE IZAKAYA  MANHATTAN  326 
6  50015250    PETITE BLUE DOG CAFE  MANHATTAN  119 
7  40388091       MASAWA  MANHATTAN  1239 
8  41456998      A.I.G.CHARTIS  MANHATTAN  175 
9  50006741      GRACE CAFE  MANHATTAN  572 
10  41377069    CATALDO'S RESTAURANT  BROOKLYN  554 
11  41145911     WA LUNG KITCHEN  MANHATTAN  557 
12  41547536    MINT'S THAI KITCHEN   QUEENS  7015 
13  41066771     DUNKIN' DONUTS  BROOKLYN  5702 
14  40365472   SPAIN RESTAURANT & BAR  MANHATTAN  113 
15  50072117        NaN  MANHATTAN  307 
16  50042671      EDGAR'S CAFE  MANHATTAN  650 
17  41490991     LIPS RESTAURANT  MANHATTAN  227 
18  41713624 BIENVENIDOS AL CALLAO RESTAURANT   QUEENS 11122 
19  40923012       DOMINO'S  MANHATTAN  200 
20  41477406     CIBAO RESTAURANT   QUEENS 10422 
21  50013522    BREWKLYN GRIND COFFEE  BROOKLYN  557 
22  41212364       BECKETT'S  MANHATTAN  81 
23  50066646     TOKOYO EXPRESS   QUEENS  7057 
24  41575815     BLACKOUT LOUNGE   QUEENS 13316 
... 
+0

ありがとうございました。私はAPIを介してファイルを使用していません。私は自分のコンピュータにローカルに保存されたcsvファイルを持っており、そのフォルダからjuypterノートブックにファイルを読み込もうとしています。 – Lenny

+0

おそらく 'df = pd.read_csv(" C:\ Temp \ Myfolder \ myData.csv ")や' df = 'pd.read_csv(" ./ RelativeFolder/ – jxramos

+0

http、pandas swapsモードでは、urllibや他のものを使ってファイルをダウンロードしてジョブを完了させるためのモードをスワップすることができます。しかし、ファイルがローカルの場合は、その必要はありません。 – jxramos

関連する問題