36k行のデータを持つGoogle精錬プロジェクトがあります。私はフリースタンダードURLからjsonデータを取り出す別の列を追加したいと思います。私は小さなデータセットで作業できるようになりましたが、このプロジェクトで実行した場合、処理に数時間かかりましたが、ほとんどの結果は空白でした。私はデータでいくつかの結果を得た。データが取得される行の量やURLからデータを取得するためのより良い方法を制限する方法はありますか?Google大規模なデータセットのためにfreebaseからデータを絞り込み、取得してURLが正しくないカラムを作成する
ありがとうございました!