2016-06-21 5 views
4

私はspaCy Pythonパッケージを使用してテキストを解析しタグ付けし、その結果の依存関係ツリーと他の属性を使用して意味を導出しています。今はSyntaxNetのParsey McParsefaceを構文解析と依存性タグ付けに使用したいと思っていますが、これは使いやすく、Parseyがしない多くのことを行うので、spaCy APIを使い続けたいと思います。spaCy APIでSyntaxNetパーサ/タグを使用するには?

  1. ボブ_ NOUN NNP _ 2 nsubj _ _もたらし
  2. _ VERB VBD _ 0 ROOT _ _
  3. _ DET DT _:SyntaxNetは、POSタグと依存タグ/ CoNLL-形式のツリーを出力します_ ADP IN _ 2分取_ _
  4. アリス_ NOUN NNP _ 5 POBJ _ _
  5. から4 DET _ _
  6. ピザ_ NOUN NN _ 2 dobj _ _
  7. 。 _。 。 _2 punct _ _

とspaCyは、CoNLLフォーマットを正しく読み取ることができるようです。here。しかし、私はspaCyのAPIがどこにCoNLLの文字列を取っているのか分かりません。 the spaCy blogから

答えて

3

は明らかに、我々はあなたが甘いスペイシーAPIで、より正確なモデルを使用することができるように、Parsey McParsefaceとスペイシー間のブリッジを構築したいです。

しかし、これが可能になるまでにまだ多くの作業があるように見えます。

spaCyの作者の回答hereも参照してください。

1

まだ誰もSyntaxNetをサービスとして実行していますか?注釈をspaCyに読み込むことは問題ありません。問題は、SyntaxNetが主に研究システムであり、実験的なニーズがディスクからテキストのバッチを処理するのに十分であるということです。

ディスクから読み込むコンテンツの場合、問題はありません。CoNLL形式で読み込んでから、注釈をspaCy Docオブジェクトに適用することができます。

+0

私もサービスとしてSyntaxNet、それに探しています、私はまだ詳細にこれを見ていないが、これは何かであると思われます方向: https://tensorflow.github.io/serving/ –

関連する問題