2018年01月03日

Alpha Zeroと学習コスト

去年はAlphaGoが話題になったが、早くもAlphaGoは引退し、完全な教師なし学習の強化学習を用いたAlphaZeroが登場した。AlphaZeroとAlphaGoを100回対戦させたところZeroが100戦全勝だったそうだ。
やはりAIは強化学習が主流となりつつある。
もしDeepMind社が将棋AIに取り組んだら、今の最強のコンピューター将棋ソフトよりも圧倒的に強いものを数日で開発するだろう。

AlphaZeroはたった3日間の強化学習でこれだけの力になったそうだが、これはGoogleの恐るべきコンピューターパワーを使ったから可能であった。
もしGTX1080のSLI接続で2つ使った程度のマシンで同じことをやろうとしたら1500年位かかる計算らしい。
今のところGTX1080のSLI接続のマシンは個人で動かせるほぼハイエンドのマシンスペックであろう。
ざっと計算するとDeepMindが使ったGoogleのマシンパワーは、このGTX1080のSLI接続で2連マシンの20万倍位の計算力ということになる。
#1500*365/3=182500 -> 約20万

学習させているときはGPUはほぼフルパワーで動いているのでGTX1080は300Wくらい消費する。
2つで600w。
この20万倍の電力となると、600*200000wとなる。
日本だと電気代は大体1Kw=30円/h
これで計算すると
120,000Kw*24h*3*30yen/kwh=259,200,000円

つまり、日本でこの学習を行うと、ざっと2億6千万円の電気代がかかることになる。
しかし、Googleは電気代の安いところで運用しているから、実際はこの1/3以下だろう。
それでも9千万円程度のコストがかかることになる。
さすがにこれだけコストがかかると、そうそう将棋でもちょっとやってみようかということにはならないのであろう。w
だが、同じ方法論で囲碁よりも将棋の方が学習コストは低く可能であろう。
posted by libertarian at 19:36| 東京 ☀| et cetera | このブログの読者になる | 更新情報をチェックする