-2

1文字に1000個のイメージがある62000個のフォントイメージ(0-9、AZおよびazイメージ)データセットがあります。イメージの標準化された62000行のcsvファイルを作成しました。ラベル。トレーニング、検証、テストのデータセットでこのCSVファイルを抽出して、より正確な精度を得ることはできません。 enter image description hereminst_digitsデータセットのようにcharデータセットを作成する方法

+0

作業にこのsklearnを読んで、また、おそらくあなたはhttps://keras.io/datasets/やhttp://scikit-learn.org/stableを使用したいです/tutorial/basic/tutorial.html#introduction?多くの機械学習プラットフォームでは、簡単にmnistを読み込むことができます。 – TheLaurens

+0

これらのデータセットは数字のみです。キャラクタデータセットを訓練したい私はデータセットを持っていますが、トレーニング、検証、テストのための簡単な方法を混乱させています。 CSVファイルのデータセットには、「A」の1000個の画像、「B」の1000個の画像などがあります。 –

答えて

0

SciKit-Learnのtrain_test_splitを使用できます。

import pandas as pd 
import numpy as np 
from sklearn.model_selection import train_test_split 

X, y = your.data, your.target #input your own data here 
train, test = train_test_split(X, test_size = 0.2, random_state=0) 

また、あなたのフォーマットにtutorial

関連する問題