0
私は約20000のテキストファイルのコーパスを持っています。これらのテキストファイルを使用してタガーを訓練したいのですが、これらのテキストファイルを1つのテキストファイルにグループ化する必要がありますタグ付けの精度に影響するかどうかを知る)、またはこれらのテキストファイルをすべてpropsファイルに含めるかどうかを確認します。トレーニング複数のテキストファイルを使用するスタンフォードPOSタグャー
私は約20000のテキストファイルのコーパスを持っています。これらのテキストファイルを使用してタガーを訓練したいのですが、これらのテキストファイルを1つのテキストファイルにグループ化する必要がありますタグ付けの精度に影響するかどうかを知る)、またはこれらのテキストファイルをすべてpropsファイルに含めるかどうかを確認します。トレーニング複数のテキストファイルを使用するスタンフォードPOSタグャー
重要ではないと思います。コードはすべてのデータをロードするだけで、複数のファイルに分割すると便利です。また、ファイルごとに異なる入力形式を指定することもできますが、最終的なモデルには影響しません。