PCAを使用してドキュメントを2ポイントに縮小しているので、それらを視覚化することができます。 私の方法はこのようになります。PCAモデルにポイントを追加する
pipeline = Pipeline([('tfidf', TfidfVectorizer())])
X = pipeline.fit_transform(sent_list).todense()
pca = PCA(n_components = 2).fit(X)
data2D = pca.fit_transform(X)
その後、私はmatplotlibの plt.scatter使用してそれらをプロットしています(data2D [:0]、data2D [:1]、C = label_colour)
を、私は2つの新しいポイントを追加して見たいですそれらはモデルに含まれます。今まで私は最終的にトレーニングデータに初期点を含め、配列の最後の2つの位置にXをプロットしましたが、これが真価を反映しているかどうかはわかりません。どんな洞察も素晴らしいだろう。