MATLAB形式のテキスト分類タスクのための信頼できるデータセットを探しています。 私はいくつかの実験をしたいと思いますし、テキストの前処理と特徴ベクトルの作成に時間をかけすぎたくありません。準備が整っていなければならないので、アルゴリズムにプラグインすることができます。私はここにロイターデータセット用のMATLABファイルを見つけました:link textMATLABのテキスト分類データ
すべてがここに用意されていますが、私はこれのサブセットを使いたいと思います。この「fea」には、各文書の特徴ベクトルが含まれています。しかし、それは通常の行列ではないようです。私はこの "fea"の中で上位1000の文書を選択したいと思っています。ダウンロードしてMATLABにロードするだけであれば、私の言いたいことが分かります。 それが可能であれば、上記のデータセットまたは代替データセットの解決策が必要です。 ありがとうございます。
私はこのコンピュータにMatlabを持っていないので、「ダウンロードしてMATLABにロードすれば、私の言いたいことが分かります。」と私にとってはあまり役に立ちません。上位1,000件のドキュメントを選択しようとすると何が起こるか説明できますか? –