就只说一条:
Alpha go Zero根本就没有人类棋手教它如何下棋。它只是被输入了围棋的基础规则,没有输入任何棋谱,直接就放手让它自己和自己下棋训练,然后……它在3小时内学会了围棋(所谓学会,就是能够基本合乎规则的走棋,不会拿围棋当五子棋下),36小时内它自己和自己下了大约110万盘,完成了自我训练的第一阶段。
之后,完成第一阶段自我训练的Alpha go Zero以100:0的比分击败了Alpha go Lee——Alpha go Lee就是当初干掉李世石的那个版本的Alpha go。
第二阶段,Alpha go Zero又进行了21天的自我训练(记住:它每天可以自己和自己下大约72.5万盘棋),然后干掉了Alpha go Master——Alpha go Master之后被拿出来挑战中日韩棋坛,5天内以60:0的战绩完胜中日韩棋坛(其中包括世界棋坛排名前20位的所有棋手),而顶峰则是3:0击败柯洁。
第三阶段,Alpha go Zero继续自我训练,当总训练天数达到40天(也就是它诞生后40天)时,自我训练达到2900万盘(我们这辈子不知道能不能下满2900盘……),对Alpha go Master的胜率超过90%——这个胜率不是靠下个几盘十几盘计算出来的,而是2个版本的狗狗对战上千盘计算出来的。
顺便提一句,Alpha go Master在自我训练的时候,是4周时间内自己和自己下了100万盘。
教Alpha go下围棋??抱歉,现在已经是Alpha go在教我们该怎么下围棋了。
于围棋一道,人类已经死定了,没救了,告辞。