2017-07-28 10 views
1

どちらも同じ形式のさまざまな動詞を表します。両方とも単一のトークンに解析してはいけませんか?たとえ2つのトークンがより意味をなさないとしても、それらは一貫していなければなりません。なぜ行けるかは1つのトークンに解析されますが、見えるのは2に見えるでしょうか?

編集:見過れることがパッシブになる可能性があるというコメントも指摘されています。もう一つの例は食べれるでしょうし、2つのトークン(食べる+)にトークン化しますが、確かに可能性があります。

+0

ちょうど好奇心から:見えるものは何ですか?見えることが受動的な形になる可能性もあります。 –

+0

見える1つのトークンとして戻ってきます。興味深いことに、行かれることは行かれてくるように戻ってきます。これは見えるトークン化とは一線を画していません(見+てれると正しいと思われます)。受動的な質問に関する良い点。 – Rollie

答えて

1

短い答え:配置する/見えることが辞書にあり、見れることはない。 (注:これはipadicとunidicの両方に当てはまります)

実行すると見れるのはかなり簡単です - 行こうとすると五段/five-step verbと見えるわけではありません。 5段階動詞のUnidicとIPAdicの茎は、動詞の終わりの処理方法によって登録されます。動詞の終わりは、基本的にすべての助動詞(単独ではできないような認識可能な単位)または支持動詞(単独で使用できるようなもの)ですが、るかいのような辞書形式の終わりは、独自の発言タグを取得せず、動詞のルートに1つのトークンを作成しないでください。

見えると状況はちょっとトリッキーです - 見えるのは潜在的な見た目ではなく、動詞として扱われています。たとえばUnidicのlex.csvを見ると、見える部分が見える部分が見えるでしょう。辞書を見ると、見ることが歴史的な理由の一部(チェックまみえる)のために、独自のエントリを持つのが一般的です。

動詞がどのように複数のトークンに分割されているのかをより詳しく説明するには、Short Unit Words、Medium Unit Words、Long Unit Words、およびBunsetsuの詳細を参照してください。ドキュメントfrom NINJALは概念をカバーしていますが、動詞の詳細はほとんどありません。 Comainuは、これらのクラスのすべてを検出できるシステムです。 this lengthy articleは英語の歴史の概要をよく示しています。

希望に役立ちます!

+0

ありがとう!それは非常に良い説明であり、リンクされたcjvlangの記事は面白いものでした。しかし、動詞の潜在的な形の中には独裁者の記入項目があることを理解していますが、私はまだなぜ(私がまみえるものは見つけられなかったのだろうか)まだ分かりません。なぜ食べれるのはリストに載っていないのですが、行けるのは何ですか? – Rollie

+0

食べるは一段活用(茎は変わらない)なので、茎(食べ物)は基本形以外の辞書の唯一のものです。行こうは五段活用(茎が変わる)なので**すべての茎変種**は辞書にあります。畳み込みの母音の変更は*茎の一部です*。 – polm23

+0

注:食べることは標準的な可能性のある形式ではなく、音声では非常に一般的ですが歴史的には文法上の誤りと考えられるものです。食べられるのは標準的な潜在的な形です。 Unidicのようならしいき言葉が含まれているようだが、IPAdicは、通常の解析では出てこないようだが... – polm23