0
私はWekaを初めて利用しています。私は感傷的な映画のレビューを分類しようとしています。つまり、単語の出現をトークン化して属性付けするStringToWord Vectorを理解できます。パーツオブパーツタグを属性ボキャブラリにも追加したいのですが、どのように悩んでいますか?Weka POSタギング+トークン化
誰もこれを前に試しましたか?
教えてください。
P.S。私はPOSタグ付けのためにOpenNLPを使用しており、Weka J48分類器を使用しています!
テキストファイルをアップロードしてからWekaでトークン化しましたか? –
うん、やったよ。私はTextDirectoryLoaderクラスを使用して、インスタンスのデータとStringToWordVectorまたはトークンでデータにアクセスしました。今、トークン化された属性ごとにPOSタグを追加する方法を理解できません。 私は自分自身で単語の出現を数えてみましたが、自分でARFFファイルを作成しましたが、エラーIOExceptionが早すぎます... –