training-data

1熱

1答えて

train（method = "glm"、...）とglm（...）は同じ回答を期待していますか？

私はtrainSAとtestSAという名前のデータセットを使用しています。とりわけ、列番号はchd age alcohol obesity tobacco typea ldlです。このコマンドは（私はRで働いていることに注意してください） set.seed(13234) modFit<-train(chd~ age+ alcohol+ obesity +tobacco +typea +ldl,

1熱

1答えて

既存のモデルに訓練データを追加する（ビンファイル）

OpenNLPを使用してnl-personTest.binファイルに余分な訓練データを追加しようとしています。私は、余分なトレーニングデータを追加するためにコードを実行すると、既存のデータを削除し、新しいデータのみを追加するという私の問題です。私は余分なトレーニングデータを置き換える代わりに追加することができますか？私は、誰でも任意のアイデアがこの問題を解決するための public clas

0熱

1答えて

SpaCyモデルのトレーニングデータを作成する方法は？

私は最近、SpaCyを使用してNLPの旅を始めました。ラベルを付ける5,500文字の文字列があります。最初の100の場合は、カスタム列を含むスプレッドシートを使用してこれを行い、スクリプトを実行してPython辞書を生成しました。このシートでは、文字列、ラベルタイプ、ラベル値を取得しました。スクリプトは、文字列内のラベル値の位置を計算します。トレーニングデータをこのようにプロダクトするのは時間が

0熱

1答えて

cnn（alexnet）をトレーニングするためのトレーニングデータのピクチャを並べ替える

私はエミュレートされた鼻のゲーム（f1レーサー）をプレイして映像を使ってalexnetを訓練しています。私はトレーニングデータをキャプチャしていますが、ゲームの背景は、グレーのピクセル値（同じ領域の淡黄色から黒色まで）になると大きく変化しています。関数（可能であれば、特定の地域）にピクセル値になると画像を比較させる関数（cv2おそらく？）またはアルゴリズムを教えてもらえますか？多分私は完全に間

0熱

1答えて

テンソルフローでラベルを送る最良の方法

私は魔法使いから画像で構成された訓練セットを持っていますが、固定数の文字と数字で形成されたラベルを予測する必要があります。これらのラベルをテンソルフローにフィードする最も良い方法は何ですか？私は数字のリストを作成することを考えました、ラベルのすべての文字/数字の1つ。私はアラ可能な値のリストを作成しました： __dict = ['a', 'b', 'c', 'd', 'e', 'f', 'g'

0熱

1答えて

特定のインデックスを使用してデータセットをテスト、検証、トレーニングに分類する方法は？

私は約189000行の大きなデータセットと、合計16個のカラムを持っています。私はそれを80％のトレーニングと20％のテストに分けたいと思っています。データセット自体の行は、最初の行の部分がニュースに関連し、2番目がスポーツに、3番目が宗教に、最後の行が一般的なグループに分かれています。私は80:20に直接分割することはできません。なぜなら、データセットの下部にあるクラスの大半がトレーニングでは見

-1熱

1答えて

データセットに重複したトレーニング

私は分類のために画像のデータセットを持っています。データセットは非常に大きく、ほとんどの画像は互いに重複しています。したがって、基本的に同じ画像が複数回現れます。さらに、データセットはアンバランスです。重複のデータセットをクリーニングする動機を理解しています。しかし、それは広範囲で、非常に時間がかかる。このデータセットでネットをトレーニングする方法はありますか？モデルに余裕がないのですか？よ

2熱

1答えて

kerasライブラリを使用してNLP分類を訓練する方法は？

私のトレーニングデータは、kerasライブラリを使ってX_dataで 'y'を予測したいと思っています。私は多くの時間エラーが発生している、私はデータの形について知っているが、私はしばらく固執している。あなたたちが助けてくれることを願っています。 X_data = 0 [construction, materials, labour, charges, con... 1 [catering

0熱

3答えて

Rで設定したトレーニングとテストに分割しますか？

次のコードをPythonでRに書くにはどうすればよいですか？ X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) トレーニングとテストセット80/20比率に分割。あなたの誰かがこのことを理解できるなら、大きな助けになります。

1熱

2答えて

Spacy 2.0 NER Training

SpacyV1では、文書とBILOU形式のエンティティ注釈のリストを提供することでNERモデルを訓練することができました。 V2トレーニングでは、このようなエンティティアノテーション（7,13、 'LOC'）を提供することによってのみ可能であるように見えます。エンティティオフセットとエンティティタグを使用します。トークンのリストを提供する古い方法とBILOU形式のエンティティタグの別のリストは有