chatgpt账号吧 关注:5,086贴子:88,875
  • 7回复贴,共1

深度聊聊deepseek对chatgpt的冲击有多大

只看楼主收藏回复



IP属地:浙江来自Android客户端1楼2025-03-15 11:51回复
    总的来讲,GPT更像一个智能的“百科全书”。过年期间总有家里亲戚长辈问我“大模型是什么”,我想了想,只能概括地回答他们——“能跟我们对话的百度”。GPT在教育、写作等领域应用广泛。它能与用户进行流畅对话,解答各种问题,是基于大量文本数据训练出来的,涵盖广泛知识。


    IP属地:浙江来自Android客户端2楼2025-03-16 23:55
    回复
      2026-01-29 05:00:14
      广告
      不感兴趣
      开通SVIP免广告
      而掀起浪潮的主角DeepSeek,它更擅长垂直领域的内容生成优化,能快速生成高质量代码片段,优化算法,还可在金融、医疗等专业领域提供精准解决方案。


      IP属地:浙江来自Android客户端3楼2025-03-16 23:56
      回复
        从大方向上对比来看,ChatGPT侧重通用对话和文本生成,适合日常交流、知识获取;而DeepSeek聚焦代码和专业领域,助力技术开发和行业应用。
        这样的差异主要是由于二者在技术架构、数据训练等方面有所不同,导致应用侧重点和效果差异明显。


        IP属地:浙江来自Android客户端4楼2025-03-16 23:56
        回复
          GPT基于Transformer架构,擅长处理序列数据,可捕捉文本中的长距离依赖关系。采用RLHF(人类反馈强化学习)的训练方法,结合人类标注数据优化模型,使生成内容更符合人类偏好。而DS采取了MoE(Mixture-of-Experts混合专家模型)架构,通过动态专家路由机制,根据不同任务分配最优专家模块。训练方法上采取了领域自适应微调(Domain SFT),针对特定领域数据进行优化,提升领域知识精度。


          IP属地:浙江来自Android客户端5楼2025-03-16 23:56
          回复
            可以说,ChatGPT架构适合通用对话和文本生成,生成内容流畅自然,但领域深度有限;DeepSeek架构在垂直领域优化能力强,擅长处理复杂任务,但通用性稍弱。


            IP属地:浙江来自Android客户端6楼2025-03-16 23:56
            回复
              ChatGPT的技术亮点在于“零样本学习能力突出”,它无需额外训练,可直接处理未见过的任务,生成合理输出,适应性强。并且随着GPT3.5,GPT4,4o的不断迭代,它的上下文长度越来越长,因此能提高话题连贯性,提升用户体验。
              DeepSeek的技术亮点,首先是采用了蒸馏的方法,通俗来讲就是DS去学习其他大模型(比如GPT)的思考过程,通过“老师(GPT)教学生(DS)”的方法来训练自己,这会大大降低成本。其次采取了动态专家路由机制,根据不同任务动态分配最优专家模块,提升任务处理效率。并且其领域知识密度优化显著:PPL指标降低15-20%,在垂直领域知识精度和深度方面表现优异。


              IP属地:浙江来自Android客户端7楼2025-03-16 23:57
              回复
                商业应用方面,DS的一大优势,也是目前人们非常关注的一个优势——可以用来炒股。DS的金融数据分析与建模能力强,可为金融机构提供精准数据分析和建模服务,助力决策制定。毕竟梁文峰是金融出身的,DS在这方面的优异表现也不愧对他多年的“深度求索”


                IP属地:浙江来自Android客户端8楼2025-03-16 23:57
                回复