高通吧 关注:183,615贴子:4,854,029

华为盘古否认抄袭阿里后,其大模型员工自曝存在套壳、续训、洗水印

只看楼主收藏回复

2025年6月30日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括70亿参数稠密模型和720亿参数的混合专家模型,宣称这是构建昇腾生态的关键举措。
然而仅隔四天,一项发布于GitHub的研究引发业界关注:用户@HonestAGI 通过“LLM指纹”技术分析指出,盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致),远超业内0.7以下的正常差异范围。
华为诺亚方舟实验室声明截图
华为诺亚方舟实验室7月5日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。
盘古团队表示,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”
然而,就在7月6日凌晨,一位自称是盘古大模型团队的员工自曝,确实存在套壳、续训、洗水印的现象。
爆料文章截图
该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品,领导层被指默许造假行为换取短期成果。
自曝文中称:“经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度,添加盘古pi论文的一些机制得来,凑够了大概135B的参数。”并表示,“听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。”“他们选择了套壳DeepSeekv3续训。他们通过冻住DeepSeek加载的参数,进行训练。”
最后他表示出于对技术伦理的坚持,决定离职并曝光内幕。
截至目前,华为并未对此自曝内容发表声明。


IP属地:重庆来自Android客户端1楼2025-07-07 14:39回复



    IP属地:重庆来自Android客户端2楼2025-07-07 14:40
    收起回复
      2025-10-20 04:47:35
      广告
      不感兴趣
      开通SVIP免广告
      H190选择性失明看不见


      IP属地:广东来自Android客户端3楼2025-07-07 15:48
      回复
        如果是抄袭阿里,那理想的智驾应该把华为ads3.0按在地上锤,ads4.0这种端侧蒸馏盘古的才能和现阶段理想的智驾相提并论。现实正好反过来,ads3.0这种规控拼接把理想智驾按在地上锤


        IP属地:山东来自Android客户端4楼2025-07-07 17:07
        收起回复
          这新闻信的人那真是有了


          IP属地:上海来自Android客户端5楼2025-07-07 18:01
          收起回复
            谷歌高级副总裁、Android系统创始人安迪·鲁宾(Andy Rubin)已经和阿里集团多次隔空喊话,安迪强调,阿里云OS很明显是从Android修改得来,因为它使用的是谷歌的运行环境、框架和工具。而阿里巴巴则否认这一说法,但承认阿里云OS使用了Android框架和工具。鸿蒙系统已经壮大,安迪却没有隔空喊华为抄袭。所以,有问题的话,阿里自然会出来说,而毫无关系的懵逼路人就别废话连篇了。主人不着急,楼主这奴才着急了。


            IP属地:广东来自Android客户端6楼2025-07-07 18:36
            收起回复
              怎么从思科事件到现在没变过


              IP属地:马来西亚来自iPhone客户端7楼2025-07-07 18:52
              收起回复
                根本不是一个级别的东西


                IP属地:河北来自Android客户端8楼2025-07-07 18:56
                回复
                  2025-10-20 04:41:35
                  广告
                  不感兴趣
                  开通SVIP免广告
                  自媒体是你爹?????这都信


                  IP属地:四川来自Android客户端9楼2025-07-07 18:56
                  收起回复
                    华为盘古大模型基于昇腾研发,而昇腾芯片广泛用于华为系电车,如果抄的阿里,为什么阿里智驾的车水平远不如鸿蒙智行?


                    IP属地:四川来自Android客户端10楼2025-07-07 19:01
                    收起回复
                      “全栈自研”


                      IP属地:广东来自Android客户端11楼2025-07-07 19:06
                      收起回复
                        惯犯,不稀奇


                        IP属地:安徽来自Android客户端13楼2025-07-07 19:10
                        回复


                          IP属地:山东来自Android客户端15楼2025-07-07 19:16
                          回复
                            惯犯的常规操作。


                            IP属地:湖北来自Android客户端17楼2025-07-07 19:17
                            收起回复
                              2025-10-20 04:35:35
                              广告
                              不感兴趣
                              开通SVIP免广告
                              先看戏,顺便坐等睿站截哥经典录屏引战


                              IP属地:湖南来自Android客户端18楼2025-07-07 19:23
                              回复