丙よりも長い時間をかけてipyparallel使用して並列化、モンテカルロシミュレーション:連載
は私が散乱媒体で光子輸送のモンテカルロシミュレーションを作っています。私は並列化しようとしていますが、実行時の性能向上をシリアルシミュレーションと比較して観察するのが難しいです。
モンテカルロコードは以下にあります。クラスPhotonには、単一光子の輸送と散乱を計算するためのさまざまなメソッドが含まれています。クラスRunPhotonPackageは、散乱媒体の所定の厚さLに対して光子のシリーズNを実行します。それらは一瞬私の唯一の入力パラメータです:
import matplotlib.pyplot as plt
import numpy as np
from numpy.random import random as rand
NPHOTONS = 100000 # Nb photons
PI = np.pi
EPS = 1.e-6
L = 100. # scattering layer thickness
class Photon():
mut = 0.02
k = [0,0,1]
def __init__(self,ko,pos):
Photon.k = ko
self.x = pos[0]
self.y = pos[1]
self.z = pos[2]
def move(self):
ksi = rand(1)
s = -np.log(1-ksi)/Photon.mut
self.x = self.x + s*Photon.k[0]
self.y = self.y + s*Photon.k[1]
self.z = self.z + s*Photon.k[2]
zPos = self.z
return zPos
def exittop(self):
newZpos = 0
def exitbase(self):
newZpos = 0
def HG(self,g):
rand_teta = rand(1)
costeta = 0.5*(1+g**2-((1-g**2)/(1-g + 2.*g*rand_teta))**2)/g
return costeta
def scatter(self):
# calculate new angle of scattering
phi = 2*PI*rand(1)
costeta = self.HG(0.85)
sinteta = (1-costeta**2)**0.5
sinphi = np.sin(phi)
cosphi = np.cos(phi)
temp = (1-Photon.k[2]**2)**0.5
if np.abs(temp) > EPS:
mux = sinteta*(Photon.k[0]*Photon.k[2]*cosphi-Photon.k[1]*sinphi)/temp + Photon.k[0]*costeta
muy = sinteta*(Photon.k[1]*Photon.k[2]*cosphi+Photon.k[0]*sinphi)/temp + Photon.k[1]*costeta
muz = -sinteta*cosphi*temp + Photon.k[2]*costeta
else:
mux = sinteta*cosphi
muy = sinteta*sinphi
if Photon.k[2]>=0:
muz = costeta
else:
muz = -costeta
# update the new direction of the photon
Photon.k[0] = mux
Photon.k[1] = muy
Photon.k[2] = muz
class RunPhotonPackage():
def __init__(self,L,NPHOTONS):
self.L = L
self.NPHOTONS = NPHOTONS
def RunPhoton(self):
Dist_Pos = np.zeros((3,self.NPHOTONS))
# loop over number of photon
for i in range(self.NPHOTONS):
# inititate initial photon direction
k_init = [0,0,1]
k_init_norm = k_init/np.linalg.norm(k_init) # initial photon direction.
# initiate new photon with initial direction
pos_init = [0,0,0]
newPhoton = Photon(k_init_norm,pos_init)
newZpos = 0.
# while the photon is still in the layer, move it and scatter it
while ((newZpos >= 0.) and (newZpos <= self.L)):
newZpos = newPhoton.move()
newscatter = newPhoton.scatter()
Dist_Pos[0,i] = newPhoton.x
Dist_Pos[1,i] = newPhoton.y
Dist_Pos[2,i] = newPhoton.z
return Dist_Pos
私は、様々な層の厚さの長さに対する位置ヒストグラムと光子の与えられた数を記録するために、次のシリアルコードを実行します。
で、その後import time
tic = time.time()
dictresult = {}
for L in np.arange(10,100,10):
print('L={0} m'.format(L))
Dist_Pos = RunPhotonPackage(L,10000).RunPhoton()
dictresult['{0}'.format(L)]=Dist_Pos
toc = time.time()
print('sec Elapsed: {0}s'.format(toc-tic))
この実行:
sec Elapsed: 26.425330162s
私はipyparallel使用してコードを並列化しよう:
import ipyparallel
clients = ipyparallel.Client()
clients.ids
dview = clients[:]
dview.execute('import numpy as np')
dview.execute('from numpy.random import random as rand')
dview['PI'] = np.pi
dview['EPS']= 1.e-6
dview.push({"Photon": Photon, "RunPhotonPackage": RunPhotonPackage})
def RunPhotonPara(L):
LayerL = RunPhotonPackage(L,10000)
dPos = LayerL.RunPhoton()
return dPos
tic = time.time()
dictresultpara = []
for L in np.arange(10,100,10):
print('L={0}'.format(L))
value = dview.apply_async(RunPhotonPara,L)
dictresultpara.append(value)
clients.wait(dictresultpara)
toc = time.time()
print('sec Elapsed: {0}s'.format(toc-tic))
それが実行されている:だから以上
sec Elapsed: 55.4289810658s
ダブルタイム!私はこれをubuntu 32ビットで4つのコアで実行していて、ipcluster start -n 4
を使って1つのコントローラと4つのエンジンをlocalhostで起動しています。パラレル化されたコードは、直列のコードを実行するのにかかる時間が1/4になると予想していましたが、明らかにそうではありません。
なぜそれを修正するのですか?
アドバイスありがとうございます。
グレッグ
を。 1マシンで13秒、4コアで0.63秒、意味がありません。(Win10、Anacondaインストール) – roadrunner66
それは私が考えていたものです。私はWindows 7、anacondaのインストール、8つのコアでそれを実行し、シリアルシミュレーションでは18秒、パラレル8コアでは28を得ました。 RunPhotonPackageをclass RunPhotonPackage(object)として定義するとエラーが発生しました。オブジェクトを削除するとコードが実行されます。私は編集し、私の質問を修正しました。 – gregory
Hm、まだ連続12秒、4つのコアに平行0.3-0.5秒、すなわち速すぎる。しかし、私はあなたのコードを実際に読んだり、出力を見たりしませんでした。 – roadrunner66