0
会社名から組織名を抽出する必要があります。エンティティを抽出するとき、 '、'または '\ n'または '時にはその他の理由で'組織名を分割します。spaCyが '、' ' n'などの理由で複数のエンティティを表示する場合、同じタイプのエンティティをマージする方法
spacy_data = nlp(text)
spacy_data.ents if ent.label_ in =='ORG'
expected output: capital international partners vi
actual output: capital
international partners vi
2つの異なる組織として表示されます。私は最終出力がcapital_international_partners_vi
になるようにして、1単語のベクトルを作成するためにさらに使うことができます。