2016-07-08 15 views
0

名前付きエンティティ認識にPyCyを使ってspaCyを使用していますが、このスクリプトでは実行するたびにモデルをロードする必要があり、読み込むには約1.6GBのメモリが必要です。
しかし、実行ごとに1.6GBは必要ではありません。
スクリプトをより速く実行できるように、キャッシュまたは一時メモリにロードするにはどうすればよいですか?spaCyモデルをキャッシュに保存する方法は?

答えて

0

まずNERを実行するだけで、ベクトルなしでパーサーをインストールできます。 これはに引数にパーサを与えることも可能である:これは、単一の実行に必要なメモリを痩身、ダウンロードする700メガバイト+グローブベクトルを防止します

python -m spacy.en.download parser

次に、ライブラリの用途/用途によって異なります。

多くの場合、spacy.load('en')のスタックの最初のにロードされたモジュール/クラス変数に渡す方が良いでしょう。

これは起動時間を少し遅くしますが、spacyは(メモリ内で)呼び出される準備ができています。

(起動時間が大きな問題の場合は、遅延ロードを実行できます)。

関連する問題