pandas.read_csv
機能は非常に柔軟で、最近herePythonでPandasのソースコードは、pd.read_csvによって処理されるURLですか?
df = pd.read_csv('http://www.somefile.csv')
を説明するように、私はこのケースが処理され、ソースコード内で検索しようとしていますURLの入力をサポートし始めています。
1)read_csv
がio/parsers.py
2)他の場所で定義された関数_read(filepath_or_buffer, kwds)
へ_make_parser_function
代表者データの読み出しによって生成関数内_make_parser_function
によって生成された、かなり一般的なラッパーである:ここで私はこれまで知っているものですin io/parsers.py
3)この関数_read(filepath_or_buffer, kwds)
はTextFileReader
を作成し、結果はTextFileReader.read()
です。しかし、TextFileReader
は、テキストファイルだけに責任があるようです。これは、様々なタイプの圧縮を扱うための機能を提供しますが、URL入力をチェックすることは何もありません。
4)一方、io/html.py
には、明らかにURLにアクセスしてhttpクエリの結果を返す関数_read(obj)
が含まれています。
この問題の簡単な解決策は、入力文字列がURLであるかどうかを確認することです。その場合はhtml
モジュールにディスパッチしてください。しかし、私はread_csv
をたどるとどこにこのようなことが起こるのか分かりません。誰かが正しい方向に私を指すことができますか?
非常に良いキャッチ! – MaxU
おかげで - 該当する行は文字通りあなたはドキュメンテーション文字列の後に指摘した関数内のコードの2行目で '_is_url(filepath_or_buffer)の場合:' –