1
私は能動的な学習を使った研究プロジェクトを研究する機械を研究しています。私はalpを使用しようとしています。これは、主流の能動的な学習テクニックの実装を提供します。alp - active learningの使用python framework
しかし、私は提供された例でいくらか混乱しています。最初の例はこれです:
from active_learning.active_learning import ActiveLearner
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
X, X_unlabeled, y, y_oracle = train_test_split(*make_classification())
clf = LogisticRegression().fit(X, y)
AL = ActiveLearner(strategy='entropy')
AL.rank(clf, X_unlabeled, num_queries=5)
そして私は、データがX、X_unlabeled、Y & y_oracleにどうあるべきかわかりませんよ。
X
には、すべてのラベルなしデータ、またはラベル付きデータとラベルなしデータの両方が含まれている必要があります。- 「y」は空のリストであるか、トレーニングデータのラベルを含みます。
y_oracle
学習データのみのラベル