NLTKを初めて使用しています。 私は構造化されていないテキストを持つファイルを持っています。テキストから私はコース名や教育を定義するフレーズを抽出したい。nltkとpythonを使用してコース名を検索
例: TEXT 1:私はコンピュータサイエンス工学の
を私の卒業を完了していると私は抽出したい単語は唯一の「メカニカルエンジニア」と「コンピュータサイエンス・エンジニアリング」している:私は機械エンジニア TEXT午前2時。
これはどのように行うことができますか? できるだけ一致する正規表現を作成する方法。