jcrfsuiteの例で示されているPOSタグ付けの例からわかるとおりです。トレーニングファイルはタブで区切られ、最初のトークンはラベルです。しかし、私はBigClusterを手に入れません。もの。誰かがトレーニングファイルにトークンを指定する方法を教えてくれますか?jcrfsuiteトレーニングファイルの形式
以下の実施例:
O BigCluster | 00 BigCluster | 0000 BigCluster | 000000 BigCluster | 00000000 BigCluster | 0000000000 BigCluster | 000000000000 BigCluster | 00000000000000 BigCluster | 0000000000000000 NextBigCluster | 0100 NextBigCluster | 01000101 NextBigCluster | 010001011111 POSTagDict | D POSTagDict | N POSTagDict |^POSTagDict | $ POSTagDict | G NextPOSTag | V 1gramSuff | i 1gramPref | i prevword |
:prevcurr ||私はnextword |予測nextword | currnextを予測|私は| Wordを予測する|私は低|私はXxdshape | | Xのcharclass 1、第一shortcapのPREVNEXTは|| = 0
テストファイルフォーマットトン予測します! BigCluster | 01 BigCluster | 011011 BigCluster | 01101100 BigCluster | 0110110011 BigCluster | 011011001100 BigCluster | 01101100110000 BigCluster | 0110110011000000 NextBigCluster | 1000 NextBigCluster | 10001000 NextBigCluster | 100010000000 POSTagDict | V NextPOSTag | metaph_POSDict | N 1gramSuff | n 2gramSuff | nn 3gramSuff | mnn 4gramSuff | mmnn 5gramSuff | mmmnn 6gramSuff | ammmnn 7gramSuff | aammmnn 8gramSuff | aaammmnn 9gramSuff | daaammmnn 1gramPref | d 2gramPref | da 3gramPref | daa 4gramPref | daaa 5gramPref | daaam 6gramPref | daaamm 7gramPref | daaammm 8gramPref | daaammmn 9gramPref | daaammmnn prevword | prevcurr || daaammmnn次の単語|。次の単語|。 currnext | daaammmnn |ワード| Daaammmnn Lower | daaammmnn | Xxdshape | Xxxxxxxxx charclass | 1,2,2,2,2,2,2,2,2、first-initcap prevnext || t = 0