美好上海吧 关注:417贴子:22,325
  • 12回复贴,共1

商汤引领全球多模态AI

只看楼主收藏回复

以SenseNova V6为矛,以SenseCore 2.0为盾,商汤引领全球多模态AI


IP属地:上海来自iPhone客户端1楼2025-04-15 08:26回复
    4月10日,商汤科技(SenseTime)在其年度技术交流日上,掷出了一枚关键棋子——全新升级的“日日新SenseNova V6”大模型体系。这不仅是一次技术的迭代,更是一次战略宣言。


    IP属地:上海来自iPhone客户端2楼2025-04-15 08:27
    回复
      2026-01-02 05:57:10
      广告
      不感兴趣
      开通SVIP免广告
      此次发布的“日日新SenseNova V6”,可谓是在这一认知下诞生的旗舰级产品。它并非单一模型,而是一个体系,包括旗舰版的SenseNova V6 PRO、性价比更高的V6 Turbo、专攻深度思考的V6 Reasoner PRO、视频理解优化的V6 Video,以及主打实时交互的V6 Omni。


      IP属地:上海来自iPhone客户端3楼2025-04-15 08:27
      回复
        亮点一:原生多模态与超强推理
        V6基于超6000亿参数的混合专家(MoE)架构,是“原生”的多模态通用大模型,这意味着它并非简单拼接不同模态的处理模块,而是在底层设计上就实现了跨模态信息的深度融合。商汤科技联合创始人林达华在采访中强调,这种原生融合是克服“跷跷板效应”(即增强一个模态能力导致另一模态削弱)的关键。经过数月的攻坚,商汤打通了模态间的桥接技术,实现了“1+1>2”的 synergistic 提升。
        V6的推理能力尤为突出,尤其是在其“慢思考”版本 V6 Reasoner PRO 上。商汤科技官方表示,其多模态深度推理能力“国内第一”,并直接对标国际顶尖水平,如OpenAI的o1模型和Google的Gemini 2.0 Pro。更引人注目的是,V6在数据分析能力上,“大幅领先GPT-4o”。这一自信并非空穴来风,部分得益于其在金融、办公(如“商汤办公小浣熊”产品)等垂直领域积累的应用经验和数据反馈。


        IP属地:上海来自iPhone客户端4楼2025-04-15 08:28
        回复
          亮点二:多模态长思维链(CoT)的突破
          推理能力的跃升,离不开商汤在“多模态长思维链”上的创新。传统思维链多为单模态(文本),而V6引入了超过200B高质量token的多模态长思维链数据进行训练,最长思维链可达64K。这意味着模型在解决复杂问题时,能够进行更长、更深入、融合图像和文本信息的“思考”过程。
          这个过程是如何实现的?并非人工标注。商汤构建了一个“思维链构造智能体工厂”,利用多个智能体协作生成和验证这些复杂的思维链。例如,在解决几何题时,模型不仅输出解题步骤,还能同步生成对应的辅助线图示,形成图文并茂的思考路径。
          林达华分享了一个生动的例子:模型为一张几只海鸥的漫画配对话,其思考过程(Think过程)长达数万字,不仅考虑了图像内容、分镜节奏,甚至捕捉到了图片角落的“微博漫画家”水印,最终生成了“职场黑话版”和“机器悖论版”两种极富创意和哲学思辨的对话。这种能力显然超越了简单的模式识别,进入了更深层次的理解和创造。


          IP属地:上海来自iPhone客户端6楼2025-04-15 08:30
          回复
            亮点三:强化学习与全局记忆的加持
            多模态强化学习(RL)是V6的另一大技术支柱。商汤构建了面向多种图文任务的混合增强学习框架,通过多难度分级和多奖励模型的训练,持续优化模型性能。实验数据显示,随着RL训练步长的增加,模型的响应长度和治理能力(解决复杂问题的能力)均显著提升。
            而“全局记忆”能力则解决了多模态信息带来的长上下文挑战。处理视频是典型的例子。一段10分钟的视频,若以每秒一帧采样,数据量就可能是文本的上百倍。商汤通过自研技术,将视觉(画面)、听觉(语音、音效)、语言(字幕、口语)及时间轴逻辑对齐,形成统一时序表征,并通过细粒度级联信息压缩和内容敏感动态过滤,实现了高达400倍(或10分钟视频压缩至16K tokens,压缩比超16倍)的压缩,同时保留关键语义。
            这使得V6在国内率先突破了长视频理解的瓶颈,支持对长达10分钟的视频进行全帧率解析和深度推理,例如自动剪辑游戏录屏的“高光时刻”并生成解说文案,或是分析课堂录像、总结重点、甚至识别老师的“板书”和“敲黑板”强调。


            IP属地:上海来自iPhone客户端7楼2025-04-15 08:31
            回复
              亮点四:实时全模态交互的革新
              伴随V6基座升级,实时交互模型也进化至SenseNova V6 Omni。它不仅在性能上对标GPT-4o mini,更在交互体验上追求“像人一样”。这体现在:
              空间交互与精准理解: 用户可通过手指“点读”屏幕上的任意区域,模型能精准理解局部信息及其与全局的关系,实现自然直观的交互,例如翻译点读场景。
              共情与情感表达: 这是商汤长期深耕“拟人对话”(其引擎在国内市场占有率领先)积累的优势。V6 Omni能够进行更自然、富有情感的交流,理解并回应用户的情绪。林达华提到,曾有用户与商汤引擎驱动的角色连续对话18小时、3000多轮,足见其吸引力。这种能力对于客服、营销、教育、陪伴等场景至关重要。
              商业化落地: V6 Omni已是国内首个商业化的全模态实时交互模型,在具身智能(如机器人交互)、文旅导览、绘本讲解、数学辅导等多个行业场景实现落地。


              IP属地:上海来自iPhone客户端8楼2025-04-15 08:31
              回复
                SenseCore 2.0:最懂大模型的“沃土”与“引擎”
                强大的模型能力离不开坚实的基础设施支撑。商汤大装置SenseCore的同步升级至2.0版本,正是其“三位一体”战略协同的体现。SenseCore 2.0 正在向着三大方向进化:
                全面拥抱开源:认识到开源模型和工具已成主流,SenseCore 2.0 提供了对开源生态(如DeepSeek等模型及相关工具链)的良好兼容性。这意味着客户可以零成本或低成本地迁移现有工作流,灵活选择使用商汤平台或开源工具,同时享有商业级的高SLA(服务等级协议)保障。对于技术能力有限的客户,大装置甚至可以提供基于开源模型的定制、训练和托管服务,“让客户专注于自己的APP和应用”。
                极致性价比:在算力成本依然是大模型应用“生死线”的背景下,SenseCore 2.0 将性价比优化到极致。
                深化行业赋能,解决“最后一公里”: 随着多模态技术打开更多场景,客户需求日益多样化。SenseCore 2.0 不仅提供算力、平台和工具,更整合商汤自身及生态伙伴(如与松影科技合作)的能力,提供针对性的行业解决方案。


                IP属地:上海来自iPhone客户端9楼2025-04-15 08:33
                回复
                  2026-01-02 05:51:10
                  广告
                  不感兴趣
                  开通SVIP免广告
                  商汤科技的2025技术交流日,不仅是一场新产品发布会,更像是一次战略方向的清晰阐述。以SenseNova V6为矛,以SenseCore 2.0为盾,商汤正全力推进其多模态AI战略,试图在激烈的竞争中开辟一条差异化路径。
                  与专注于语言模型的DeepSeek等玩家不同,商汤选择了一条更艰难但也可能更宽广的“原生多模态”道路。虽然在某些技术理念(如CoT、RL)上可能与DeepSeek殊途同归,但其出发点和核心优势在于视觉和多模态融合。面对OpenAI、Google等国际巨头,商汤凭借对国内市场的理解、B2B的深厚根基以及模型与基础设施的协同效应,力图在国内市场建立壁垒,并在国际技术前沿保持跟进甚至局部领先。


                  IP属地:上海来自iPhone客户端10楼2025-04-15 08:34
                  回复
                    简要总结,商汤第六代大模型日日新SenseNova V6,其技术能力上的突破,重在四个方面:
                    长思维链:超过200B高质量多模态长思维链数据,最长64K思维链;
                    数理能力:数据分析能力大幅领先GPT-4o;
                    推理能力:多模态深度推理国内第一,对标OpenAI o1;
                    全局记忆:率先在国内突破长视频理解,支持10分钟的视频理解及深度推理。


                    IP属地:上海来自iPhone客户端11楼2025-04-15 08:36
                    回复
                      有港股 市值500多亿,今几年有点苗头了,烧钱厉害


                      IP属地:上海来自Android客户端13楼2025-04-15 15:30
                      回复


                        IP属地:上海来自Android客户端14楼2025-04-16 11:49
                        回复