私はデータフレームパンダ:マルコフ連鎖を使用してクラスタリングデータは
私はIDをクラスタリングする必要がmember_id domain
111 vk.com
111 facebook.com
111 stackoverflow.com
222 facebook.com
222 twitter.com
333 wikipedia.org
333 vk.com
333 facebook.com
を持っていると私は、ドメインパスからマルコフ連鎖を取得する必要がありますが、私はいくつかの困難を持っています。
111: vk.com -> facebook.com -> stackoverflow.com
222: facebook.com -> twitter.com
333: wikipedia.org -> vk.com -> facebook.com
すべてのIDに隣接行列を作成する必要がありますか?それをクラスタリングする方法は何ですか?それとも別の方法がありますか? または私はすべてのパスを取得し、すべてのIDと比較する必要がありますか?