私は最近、SpaCyを使用してNLPの旅を始めました。ラベルを付ける5,500文字の文字列があります。最初の100の場合は、カスタム列を含むスプレッドシートを使用してこれを行い、スクリプトを実行してPython辞書を生成しました。このシートでは、文字列、ラベルタイプ、ラベル値を取得しました。スクリプトは、文字列内のラベル値の位置を計算します。SpaCyモデルのトレーニングデータを作成する方法は?
トレーニングデータをこのようにプロダクトするのは時間がかかりますが、エラーが発生する可能性があります。
これを支援するツールはありますか?文字通り、部分文字列を強調表示してから、ラベルの種類を選択するだけで済みます。私はそれを自分で作ることができましたが、すでに存在するかもしれないと感じています。
お返事ありがとうございました。私は実際に受け入れられるのを待って、昨日ベータ版にサインアップしました。 –
ああクール!小さなバッチで招待状を送り出して、バグをすばやく修正できるようにしました。もしあなたが好きなら、あなたは私にメールを送ってあなたの人を知っているので、招待状の次のバッチにあなたを追加することができます:) –
素晴らしいメールが送られました。ありがとうございました! –