私はニュース分類でプロジェクトをやっています。基本的には、事前定義されたトピック(スポーツ、政治、国際など)に基づいてニュース記事を分類します。システムを構築するには、システムをトレーニングするための無料のデータセットが必要です。ニュース記事データセット
これまでのところ、グーグルで2,3時間後にhereというリンクが見つかったのは、thisです。これで十分ですが、私はもっと見つけようと考えています。
注意私が欲しいのデータセットその:
- は、完全なニュース記事だけでなく、タイトル
- は、XMLまたはデシベル
、.txt形式で英語
ええ、私はプロジェクトに忙しいので、データセットを見つけようとしていますので、やることを減らそうとしています。さらに、私はPython/Perl/PHPでスクリプトを書く方法を知らない。 – Hearty