感觉亚托莉学会打人,是因为机器人把和主人交互的内容作为数据集对自己进行了模型微调(理由:就算被清除了之前的记忆,但是亚托莉还是会说自己是高性能的,说明这一点已经被融入到了模型内部,这只有微调模型能做到。猜测开放微调权限是为了让机器人更好地扮演自己的角色),然而这些数据集是未经审查的(uncensored),又由于主人被霸凌后对亚托莉输出了暴力倾向内容,然后些带有暴力因素的数据集被微调进了亚托莉的模型里面,导致ai生成了违背限制词的指令(打人指令),这是事件的来源。小西久作也是活该,不多加点限制并且没有严格测试就拿出去卖,他不出事就怪了呢。猜测亚托莉被抓回去后清除了前面的知识库(对话记录),但是没对模型做出改变,也没对微调机制做出改变,只是加了一些限制词让亚托莉没法回忆起之前的具体内容,但是通过安田回收亚托莉的事件,包括阅读自己之前的日志(知识库),这些数据集又给训练进去了并且生成了知识库,然后那些限制回忆的限制词又没卵用了。至于ai能不能训练出人类的感情,现在的科技真不行。不得不说亚托莉算力真的强,不知道拿她内部算力芯片来跑我那破机器学习有多爽









