私は大量の(20Mbを超える)多数のデータファイルに依存する新しいPythonパッケージを開発中です。具体的には、ライブラリーは、実行時にデータ・ファイルがdata/
ディレクトリーにあることを予期します。_large_データ依存性を持つpythonパッケージを配布するには
現在、私は配布パッケージの一部として "data"ディレクトリにあり、python setup.py install
を介してこれらのファイルをユーザのシステムにインストールするようにsetup.pyスクリプトを設定しています。これは今のところうまくいきますが、tarballが 数百Mbを超える可能性があるので、PyPIへの配布をアップロードできないようです。
代わりに、私はPyPIに親切であるようにリモートサイトのファイルを "ホスト"し、ファイルを自動的に取得してインストールしたいと思います。これは既存のPython配布技術を使用して可能ですか?もしそうなら、これを行う方法や例を挙げてください。それが不可能な場合は、これを取り除くためのベストプラクティスは何ですか?
あなたが提供できる洞察は大歓迎です。
ありがとう、これは興味深い選択肢です。私は単純にモジュールが既にインストールされていると仮定してモジュール___ file__を照会し、返されたパスに基づいて適切な場所にデータファイルを配置するget_data.pyという小さなスクリプトを書くことができたと思います。 – jobu
ユーザーが実行されていると仮定すると、ディレクトリへの書き込みアクセス権があります。 – forivall
ありがとうございます。率直に言えば、setup.pyのpackage_dataの要件をURLのリストに示すだけで驚いています。 – jobu