私はドイツ語の形態素解析を行うことができるライブラリを探しています。つまり、任意の単語をそのルート形式に変換し、解析された単語についてのメタ情報を提供します。例えばドイツ語の形態素解析のための無料のライブラリはありますか?
:
gegessen -> essen
wurde [...] gefasst -> fassen
Häuser -> Haus
Hunde -> Hund
マイウィッシュリスト:
- それは名詞と動詞の両方で動作するように持っています。
- ドイツ語の複雑さを考えると、これは非常に難しい作業であることを知っています。したがって、近似値のみを提供するか、または80%正確である可能性のあるライブラリを探しています。
- 私は辞書では動作しないライブラリが好きですが、やはり状況を考慮して妥協することはできません。
- 私はC/C++/DelphiのWindowsライブラリも好んでいます。これは.NET、Java、...などの統合が容易になるためです。
- 無料のライブラリである必要があります。 (L)GPL、MPL、...
EDIT:私はので、不規則な言葉で、まったく辞書なし形態素解析を実行する方法がないことを承知しています。私が言うとき は、私はそれぞれ、すべての単語をマップこれらの本格的な辞書を意味辞書なしでライブラリを好む:
arbeite -> arbeiten
arbeitest -> arbeiten
arbeitet -> arbeiten
arbeitete -> arbeiten
arbeitetest -> arbeiten
arbeiteten -> arbeiten
arbeitetet -> arbeiten
gearbeitet -> arbeiten
arbeite -> arbeiten
...
これらの辞書は巨大なサイズと未知語を処理できないことを含む、いくつかの欠点を持っています。
もちろん、すべての例外は、唯一の辞書で扱うことができます。
esse -> essen
isst -> essen
eßt -> essen
aß -> essen
aßt -> essen
aßen -> essen
...
(私の心は:)今回っている)
あなたは部分的に正しいですが、私は私の質問を更新しました。 –