mapreduceでPageRankを実装しようとしているときに質問があります。 ここにコードを引用して、問題を説明するhttps://stackoverflow.com/a/5029780/1117436とします。上記のプロセスでmapreduceでページランクを計算するときの反復方法
map ((url,PR), out_links) //PR = random at start
for link in out_links
emit(link, ((PR/size(out_links)), url))
reduce(url, List[(weight, url)):
PR =0
for v in weights
PR = PR + v
Set urls = all urls from list
emit((url, PR), urls)
、それは地図手続きの入力の2番目のパラメータはURLからのリンクであるが、削減手順の出力の2番目のパラメータは、URLの中のリンクであると思われることを明確です。では、これらのコードはどのように反復して動作しますか?
次に、ページランクのアルゴリズムが正しく動作するようにコードを書く方法を教えてください。
更新:この回答は私の問題を解決すると思います。 https://stackoverflow.com/a/13568286/1117436
ありがとうございますが、私はちょうどpagerankアルゴリズムでお互いにマップの縮小と入力の出力を行う方法を知りたいです。 –