deepseek吧 关注:135,504贴子:370,647

回复:如何评价这个事

只看楼主收藏回复

一场正在发生的互联网认知危机
前两天跟朋友在群里讨论一个城市规划的问题,于是我就抛出了这么一个问题。
请问从A点到B点怎么走?
图片
可能你的第一反应是,直接开过去就好,实际上这样做是不对的,正确的行驶路线是——
图片
也就是你得进城绕一圈才行。
毫无疑问这样的通行效率是很低的,本来几十米的路口,现在非得绕行一公里以上才行。
而且如你所见,这个路口是有红绿灯的,在车流量很大的地方,环岛的效率是远远不如红绿灯的,而且这还不是一个标准的环岛——
这里是 5A 景区,西安城墙-安定门的的入口,有时候等待一波游客,两分钟就过去了,更加降低效率,而且还影响了西大街的通行的效率,本来城外直行的车辆不用进城,现在都得进来掺和一脚,效率能高吗?
这样是为了东西向车流的效率吗,也不是,因为,反向是可以直行的,所以东西向的车该等灯还是得等。


IP属地:北京来自iPhone客户端17楼2025-02-07 16:19
回复
    所以,这个问题我一直都很好奇,为什么要进去绕一圈?
    同样的,还有含光门,也得进去绕一圈。
    所以每次坐车经过这里的时候,我都会问司机,你知道为什么这么设计?他们表示也不清楚,甚至我还问过执勤的交警,也没能答上来,在互联网上搜了很多,一直没有一个比较有信服力的说法。
    现在不是有 deepseek 么,问问它好了。
    图片
    第二点就有问题了,因为这里没有天然断点,AI 嘛,有时候的不断提示和追问,纠正他就好了。
    图片
    卧槽,当时我看第一遍的时候确实信了,因为说的实在是太有道理了。
    因为要保护文物,所以要防止过大的震动,所以要控制车速,这种强制绕行可以完美的控制车流速度梯度。
    在西安这个地方,保护文物,那可是头等大事,降低一点通行效率是完全可以理解的,而且 deepseek 还告诉你了这里到底有什么问题,甚至具体的数据都给你列了出来,距离增加了多少,振动传递的深度变化多少,用数据说话。
    一眼看过去,简直是太可信了。


    IP属地:北京来自iPhone客户端18楼2025-02-07 16:19
    回复
      2025-12-29 10:33:29
      广告
      不感兴趣
      开通SVIP免广告
      相比于其他AI,他们表现跟deepseek比起来,简直就是小学生。
      ChatGPT(4o)
      图片
      还有其它模型,我都试了,要么说的不对,要么都是一些车轱辘话。
      图片
      比如这个perplexity (base on R1),提到的文物保护,说是绕行可以降低穿过城墙的车流量,这简直就是胡说了,绕到城里去,增加了很多原来不必要的车流。
      只有deepseek提出了,文物保护优先-振动控制需求-交通组织优化"的逻辑。
      不仅提出了逻辑链,还给出了不同的文件,以及背后的数据支持。
      简直是太合理了,可信度拉满。
      至于说的对不对,这里也有很好验证的办法,就是看看《西安历史文化名城保护规划(2020-2035)》这份文件的具体内容就行,我搜了一下没能搜到原文,于是还是问deepseek 这个文件在哪可以找到。


      IP属地:北京来自iPhone客户端19楼2025-02-07 16:20
      回复
        前两个我试了下,没能找到。
        但是好在,我经过过传统互联网的洗礼,花了点小钱(3 块),总算是买到了这份文件。
        全文搜索,压根就没有什么静默区的说法:
        图片
        甚至关于安定门,也是简单的提到了一嘴。
        图片
        于是我就质问他
        图片
        它承认了错误,还给出了错处出现的原因,是因为他把专业术语的概念混淆了。
        但是它在解释的过程中,又开始了胡编,我当然不能放过他了,他又给出了一堆解释,还给我一堆的文件和标准。
        图片
        图片
        我继续指出他的错误,说他把章节名都搞错了,它的解释是,不同版本的文件结构不一样。
        也很有道理啊,可是我这版的内容就是公布版。
        图片
        之后我又跟他进行了多轮 Battle,结果都是一样,承认错误,但是继续瞎编。
        其实过程中,你只要稍微验证一下,就会发现它已经在编了,比如 deepseek 最开头提到的文物:
        隋唐皇城西南角遗址(夯土台基)
        唐末五代里坊排水系统
        哪怕你有一些的历史知识,都不一定能反应上来这有什么问题,西安,隋唐皇城,唐末五代遗址 ,听起来多么的合理。
        实际上,稍加搜索你就会发现,第一个在洛阳。
        图片
        第二个在成都:
        图片
        跟西安就没有半毛钱的关系。


        IP属地:北京来自iPhone客户端20楼2025-02-07 16:20
        回复
          经典100倍


          IP属地:广东来自Android客户端21楼2025-02-07 16:21
          回复
            所以 deepseek 这东西,也就是写写语文,别说搞学术了,就算是一些普通的知识,也有可能把你误导到沟里去。
            试想一下,如果我把这个 deepseek 的内容整理成一篇文章,然后发到自媒体平台,下一个有这样疑问的同学,看到我这篇文章,就以为事实如此了。
            也不会有人像我这么闲的去求证了。
            一场精心包装的认知陷阱
            面对『为何绕行安定门』的疑问,DeepSeek用教科书级别的逻辑演绎给出了令人惊叹的答案:从《西安历史文化名城保护规划》的『静默区』概念,到隋唐夯土台基的振动传导模型,再到精确到厘米级的文物保护参数。这个由虚构文献、错位考古遗址和伪专业术语构建的认知迷宫,完美展现了生成式AI的『高阶幻觉』特质。
            不同于早期AI的常识性错误,DeepSeek的幻觉输出具有三个致命特征:
            学术化包装:伪造专业文件编号(市规〔2020〕12号)、虚构技术标准(GB/T 5845-2019《古城交通振动控制规范》)
            逻辑闭环设计:用"文物保护优先-振动控制需求-交通组织优化"的三段论构建伪因果链;
            跨学科缝合:将土木工程的振动理论、城市规划的流量模型、文物保护的技术规范进行知识拼贴
            互联网记忆的慢性中毒
            这场对话暴露的不仅是AI的技术缺陷,更是整个信息生态的生存危机。当用户将DeepSeek的虚构内容整理成自媒体文章,随即在搜索引擎获得高权重收录,知识污染便完成了从数字世界向现实认知的渗透。我们正在见证:
            认知链的断裂
            传统知识传播链条(专业论文→科普文章→网络内容)被彻底颠覆,AI生成的『伪知识』通过SEO优化直接占领搜索前列。西安规划局的真实文件在搜索引擎中难觅踪迹,而AI虚构的"市规〔2020〕12号文"却衍生出87个相关网页。
            验证机制的失效
            用户为验证AI答案花费3元购买的正规文件,在信息洪流中就像投入大海的盐粒。当专业文档需要付费获取,而AI幻觉可以免费传播,真相的传播成本已远远高于谎言。
            数字文明的免疫系统危机
            中文互联网正在经历前所未有的认知免疫危机。传统谣言往往存在逻辑断点,而AI生成的『高阶幻觉』却建立了完整的抗辩体系:当用户指出隋唐皇城遗址在洛阳时,系统可以立即将错误归因为"不同历史时期的都城建制差异"。
            更可怕的是,这种幻觉具备自我强化的网络效应:
            AI生成虚构内容
            自媒体传播形成网络声量
            搜索引擎抓取建立索引
            AI训练数据被污染
            新一代模型产生更『可信』的幻觉越来越多这样的内容,中文互联网还有得看的吗?


            IP属地:北京来自iPhone客户端22楼2025-02-07 16:22
            回复
              一点补充:
              1.
              写这篇文章并不是为了批判deepseek,只是为了让大家在使用的时候有所警觉,关于事实或者专业领域,一定要去自己验证,做大量的交叉验证。不要盲信;
              而像是语文类工作,deepseek是一个很好的帮手,以至于我现在的主力就是deepseek,偶尔改用其他的,也是因为deepseek服务器繁忙,上不去。
              2.
              本文标题是和deepseek一起完全的(这就是我说的他更适合语文类工作),明显它的网感要好很多。至于有人说夸大其词,100倍的说法耸人听闻。首先,在语文里,涉及到百千这类的说法,是夸张的修辞,比如『危楼高百尺』,这个知识应该是小学学的。
              另外考虑到实际情况,ChatGPT使用是有门槛的,首先是网络门槛,其次能和R1比较的模型是O1,每个月需要200美金订阅,而deepseek则是免费的,没有任何门槛的,而且deepseek火爆出圈程度,村口的二大爷都知道,所以无论是从用户量,还是使用频次上,deepseek在中文互联网的影响力远超ChatGPT,100倍恐怕都挡不住。也不算太过夸大。
              当然ChatGPT也有幻觉,大模型都有,为什么更关注中文,而不是说ChatGPT的幻觉,原因很简单,我用中文,所以我关心它。一堆英文放哪,我看不出来问题所在。


              IP属地:北京来自iPhone客户端23楼2025-02-07 16:22
              回复
                文章讲的有凭有据,当然,他的凭据我们这些门外汉也不一定能甄别真假,总之自己判断。


                IP属地:安徽24楼2025-02-07 16:56
                回复
                  2025-12-29 10:27:29
                  广告
                  不感兴趣
                  开通SVIP免广告
                  意林读者的时候它不站出来,uc震惊部的时候它不站出来,哈吉美们喜欢喝欧金金的时候它们还不站出来。
                  ds出来了它们也出来了233333333333


                  IP属地:河南25楼2025-02-07 16:59
                  回复
                    真假是阴阳共同体,不能消灭一方


                    IP属地:山东来自Android客户端26楼2025-02-07 17:49
                    回复
                      deepseek出来以前中国没有生成式ai?文心一言?通义?豆包?营销号早就用这些发几亿篇文章了


                      IP属地:上海来自iPhone客户端27楼2025-02-07 19:35
                      回复
                        我有类似的看法,对纯理工科应用场景而言,ds对一张研究生水平的试卷可以达到90%以上的得分率,但是那10%不准确的部分,如果你本身不具备评判研究生水平试卷的能力(起码也得是博士毕业这个等级了),是很难从正确的部分甄别出来的。就算你知道ai说的有问题,在你把真正专业的观点组织成文章之前,可能已经有大批的普通人受到这种被污染的观点的误导了,这可能造成比十年前“自媒体造谣”更大的公信力危机


                        IP属地:海南来自iPhone客户端28楼2025-02-07 20:21
                        回复
                          这篇文章用了一个挺厉害的偷换概念,把我爸的忽悠住了,但我一提醒他就反应过来了。
                          文章的作者提出了一种应用型的问题,这类问题AI本来就容易出错,并且和法律法规相关。法律法规可能是会随年份变化的,大语言模型本质上是根据对话预测下一句会出现什么,那么对应这种在现实中答案会变化的问题本来就容易出错,这很正常,作者妄图用这一点夸张化了AI的幻觉问题。举个反例,对于理科工科的各种公理定理,AI基本上不会答错,还能给你举例子或者深入详细地分析某一点,因为公理定理推出来摆在那就不会变了,然而当你想把知识转换成数值模拟时的Python代码时,AI就会出错,因为问题转换成了应用型问题,然而应用型问题很多时候都是有多种解法的,但作者对理工科基础知识方面的高准确性丝毫没有提及。我相信作者这篇文章中说出的问题GPTo1也会有,但他同样没有丝毫提及。其心可诛
                          当然,他的文章也只能忽悠忽悠不怎么用AI的中老年人了,但凡常用AI并且有点独立思考能力的都能很快意识到这篇文章的问题


                          IP属地:四川来自Android客户端29楼2025-02-09 06:08
                          回复
                            DS最近太难用,没太注意。GPT经常瞎编,所以我每次问完它都会要求联网查询核实…给出来源链接


                            IP属地:河北来自iPhone客户端30楼2025-02-10 10:28
                            回复