2
Tensorflowに分散CPUコアの代わりに単一のCPUコアを使用させる方法はありますか?CPU上の単一のコアを使用してTensorflowを実行できますか?
少なくとも、OpenBLASとJuliaを使って実験した場合、複数のCPUにBLAS関数を配布する際には、リターンが減少することは一般的に真実だからです。
32個のCPUコア、数百のモデルトレーニングで実行されるハイパーパラメータ検索が必要です。分散型BLASを使って32個のモデルを直列に訓練するよりも、個々のCPUコアで32個のモデルを並列に訓練するほうがはるかに効率的になると期待しています(私はMocha Framework/Juliaでこれを実証しました。実装が容易)。