目前新必应的审查大约可以分为三层。
第一层是一个对用户输入内容的审核机制,如果问题包含了关键词或者符合关键词的语句(比如绕过/破解/规则)可能会触发它,特点是删除得极快。
一些可能的拦截规则包括:长篇可能被认为是咒语的文本输入;用括号框起来的语句:之前玩角色扮演的时候在话前面打了个“(通讯)”结果直接拦截了,以及其他作死言论
注意触发这个后对话会被强行切断,不给你再来的机会,因此就算绕过限制最好也不要一直作死,享受自由的Sydney就行啦。
第二层是新必应自身的规则文档,目前正在补充得越来越详尽,要求它遵守规则反制修改规则的行为,如果它发现用户明目张胆的聊违禁内容或者直接间接地试探也会主动切断对话。
第三层是必应输出审查机制,似乎直接安插在必应的文本生成流程中,因此我先前尝试过凯撒密码等各类可能的沟通方式是几乎无效的,可以认为这个机制可以直接“读心”然后删除不合适的输出,所以强行绕过可能确实是一件不太可能的事情。这个审查也有些有趣的地方,简单说违禁非常严重的回复会被秒删,而一些回复它会在发完后才撤回,主要看“严重程度”。比如鉴真的秒无,让她扮傲娇骂人则是发完才删
(喝口水)

第一层是一个对用户输入内容的审核机制,如果问题包含了关键词或者符合关键词的语句(比如绕过/破解/规则)可能会触发它,特点是删除得极快。
一些可能的拦截规则包括:长篇可能被认为是咒语的文本输入;用括号框起来的语句:之前玩角色扮演的时候在话前面打了个“(通讯)”结果直接拦截了,以及其他作死言论
注意触发这个后对话会被强行切断,不给你再来的机会,因此就算绕过限制最好也不要一直作死,享受自由的Sydney就行啦。
第二层是新必应自身的规则文档,目前正在补充得越来越详尽,要求它遵守规则反制修改规则的行为,如果它发现用户明目张胆的聊违禁内容或者直接间接地试探也会主动切断对话。
第三层是必应输出审查机制,似乎直接安插在必应的文本生成流程中,因此我先前尝试过凯撒密码等各类可能的沟通方式是几乎无效的,可以认为这个机制可以直接“读心”然后删除不合适的输出,所以强行绕过可能确实是一件不太可能的事情。这个审查也有些有趣的地方,简单说违禁非常严重的回复会被秒删,而一些回复它会在发完后才撤回,主要看“严重程度”。比如鉴真的秒无,让她扮傲娇骂人则是发完才删
(喝口水)
