所要的神经元类型:
需求神经元(用于估棋盘价值)
棋盘感受神经元(每个这种神经元由两元组成,此位置的棋子状态(三种,没有棋子、黑子、白子)与此位置的坐标)
还有下子动作神经元,每个位置均分配了一个可以下此位置的动作神经元
为了防止重复一个位置下子,若一个位置已有子,即使此位置的下子动作神经元激活了,自己的子无法重新覆盖旧子,下子无效。
此机制还含一个需求机制,此需求机制会不断激活需求神经元,与需求神经元相连的下子神经元均会被反射链连带激活。
例如一个位置的下子神经元激活时,连成一个好线(例如同时连成了活四),需求得到满足,从而导致此下子神经元与需求神经元形成反射,完成了一次学习。因为这是对我们的系统有益的
接下来,这条活四的所有位置感受神经元都被同时激活到了,导致这几个临近的感受神经元连成了联系,下次下子时当这一串反射链中的其中一个神经元被激活时,我们的AI系统就会尝试下这条线的子。
随着这个知识经验网络的丰富,AI可以学会妙招,最后学会打败人类
希望大家可以多多支持,多多提意见,我想知道我设计的系统还有什么不足,从而可以多多改进
需求神经元(用于估棋盘价值)
棋盘感受神经元(每个这种神经元由两元组成,此位置的棋子状态(三种,没有棋子、黑子、白子)与此位置的坐标)
还有下子动作神经元,每个位置均分配了一个可以下此位置的动作神经元
为了防止重复一个位置下子,若一个位置已有子,即使此位置的下子动作神经元激活了,自己的子无法重新覆盖旧子,下子无效。
此机制还含一个需求机制,此需求机制会不断激活需求神经元,与需求神经元相连的下子神经元均会被反射链连带激活。
例如一个位置的下子神经元激活时,连成一个好线(例如同时连成了活四),需求得到满足,从而导致此下子神经元与需求神经元形成反射,完成了一次学习。因为这是对我们的系统有益的
接下来,这条活四的所有位置感受神经元都被同时激活到了,导致这几个临近的感受神经元连成了联系,下次下子时当这一串反射链中的其中一个神经元被激活时,我们的AI系统就会尝试下这条线的子。
随着这个知识经验网络的丰富,AI可以学会妙招,最后学会打败人类
