配列と長いデータ型を含むと思われる独自のデータ型を作成しようとしています。 Public Type MyData
Cluster() As Variant
Centroid As Long
End Type
そして、私はそれを使用するためのサブを作成しました:私は、パブリック型としてそれを定義した Sub Mycluster()
Dim Cong As MyData
Dim i As
私はクラスタ評価でSSB計算で少し混乱しています どこ |Ci| is the size of cluster i
ci is the centroid of cluster i
c is the centroid of the overall data
この「全体的なデータの重心」とは何ですか? どこでも全体のデータの重心として言及されています。 私たちは計算のために取る初期セントロイド
つぶやきセットをクラスタ化したい。私はすでにつぶやきを取り出し、それらをきれいにし、ナイーブベイズ分類器をそれらに適用し、それらを正と負の2つのファイルに分けました。最後に、私は、各つぶやきの間の類似性を検索するために次のことを行っている:さて、これは、私は追加するかもしれない次のステップを考えていた他の各文の相対的な類似性を測定することになっている with open("positive.txt