deepseek吧 关注:136,344贴子:378,026

我发常用的大模型,大伙来打分

只看楼主收藏回复

如题,这里的范围是指现阶段主流的大语言模型(排除掉画图模型,视频模型之类的),有些楼主没有体验过的就不给予评价。
5:神中神
4:稳定好用,几乎没有什么短板
3:一般般
2:路边一条
1:拉爆了
deepseek镇楼


IP属地:江苏来自手机贴吧1楼2025-08-09 19:58回复
    1.chatgpt,作为从23年用到现在的老用户,刚出来的时候5,毕竟从GPT3.5到GPT4是巨大的提升,特别是中文语义上的理解,后来会根据IP降智3,纯纯的恶心用户,从去年九月份发出的o1preview到正式版将近等了半年,sora也是从去年春预告,等了一年才发布。要不是因为deepseek半路杀出,我估计GPT5现在都不一定发布。但是这个暑假发的东西挺多的,开源的oss,agent,GPT5(免费用户一天可以用40次大概),综合下来给个四分。


    IP属地:江苏来自手机贴吧2楼2025-08-09 20:03
    收起回复
      2026-01-20 07:17:07
      广告
      不感兴趣
      开通SVIP免广告
      2.gemini,这个无需多言5。免费可用的API,虽然中途收回过2.5pro,但是还是在六月底加回来了。从三月份霸榜到现在,学生认证还能免费使用15个月的pro会员。我现在基本上将gemini当Google搜索使了。Google也是逼迫openai发出了GPT5。


      IP属地:江苏来自手机贴吧3楼2025-08-09 20:06
      收起回复
        3.Claude,编程利器,但是在其他方面(比如说解题)并不特别出彩,在安全方面上,anthropic下足了功夫,现在发了opus4.1,边城还是稳居第一,但是GPT5,gemini也不差,算的是那一种有特长,但是其他的都比较平庸,而现在,这个特长也不算很长了,综合来看给到4。


        IP属地:江苏来自手机贴吧4楼2025-08-09 20:09
        收起回复
          4.grok,我是从grok2开始用的,当时好像还送25美元的API ,说实话,也是一般般给到3,后来grok3的时候号称地表最强,用起来感觉也就比deepseek r1快一点,但是它的优势是没有审查,毕竟是用Twitter上的数据训练的,刚出的grok4没充会员,不给予评价,但是在群听说有那个ai女友,尺度很大,看来老马有意向将grok往r18引。综合评价来看,日常使用3,角色扮演5(不用破甲)。


          IP属地:江苏来自手机贴吧5楼2025-08-09 20:14
          收起回复
            5.llama,毕竟是在四月份的时候开源了llama4,所以我给到这个席位,虽然这个模型是跑分模型,实际体验很差,但是去年的时候,llama3.1 405b是可以硬刚当时的chatgpt4o的存在。llama3系列在开源方面算得上是一个很强的模型,而且meta又从openai那边挖了几个核心人才,外界消息说下一个模型不一定开源了。综合来看给一个3。


            IP属地:江苏来自手机贴吧6楼2025-08-09 20:18
            收起回复
              6.copilot,这个是内嵌在office里面,当时好像是chatgpt4o的套壳,体验效果还是可以的,就是环大陆,可惜现在Microsoft和openai不合作了,我估计能用到的场景,也就是辅助写作之类的。给个2~3分。


              IP属地:江苏来自手机贴吧7楼2025-08-09 20:20
              收起回复
                国内这边,1.deepseek,作为年初杀出的黑马,可以硬刚chatgpt o1的存在,这个可以给到5,对于我而言,它的意义就是将成本打下来。反正,当时深度思考这一块,国内就没有模型能比得上chatgpt。deepseek对于我而言,最大的意义就是量大管饱,API充了几十块钱,现在都还没用完。出了0528模型之后把幻觉降了一些,但是还是没有多模态。毕竟当时deepseek的优势就是免费,便宜的API,开源,但是现在这些优势都不存在了,免费的国产模型追了上来,Google有教育优惠,免费的API,openai开源了oss(虽然跑分虚高,但是我体验下来,20B的模型相当于o4mini),但是用户还是在的,周围朋友都在用,综合下来给个4分


                IP属地:江苏来自手机贴吧8楼2025-08-09 20:27
                收起回复
                  2026-01-20 07:11:07
                  广告
                  不感兴趣
                  开通SVIP免广告
                  歇一会儿,等会再写


                  IP属地:江苏来自手机贴吧9楼2025-08-09 20:27
                  回复
                    淡季贴吧


                    IP属地:江苏来自手机贴吧10楼2025-08-09 20:40
                    回复
                      忘了叠甲了,楼主评价纯属主观臆断,若有异同,都以你们的观点为主


                      IP属地:江苏来自手机贴吧11楼2025-08-09 20:48
                      回复
                        2.豆包,破了限之后写小说的话算可以,并没有什么明显的像deepseek一样的玄幻风幻觉,但是在有的时候就特别唐,更别说在deepseek开源之前没有深度思考了,特长就是在生成图片和视频这方面还是很不错的,但可惜这不是本帖的重点。在聊天这一方面,我只能给到2~3分。(附上梗图)


                        IP属地:江苏来自手机贴吧12楼2025-08-09 21:15
                        收起回复
                          3.Qwen,作为中文大语言模型开源的神,在deepseek开源之前可以算得上是no.1,在社区方面有魔搭,开源的模型类型也很丰富,楼主是从qwen2用到现在,没有优势,也没有短板,中规中矩,但是最近开源的qwen3跑分虚高,在代码方面也不是像之前在国产中名列前茅了,尝试了几个项目之后,我感觉不如deepseek(Qwen3 coder),最近发布的Qwen coder效果也不太好。


                          IP属地:江苏来自手机贴吧13楼2025-08-09 21:23
                          收起回复
                            Qwen补充:它在4月的时候出了一个深度研究和类似agent的功能,楼主体验过深度研究,论深度不如GPT(至少chatgpt在搜索之前会给出五个提问点拓展),论广度不如grok3(r18的内容也可以搜索)所以我觉得这个只是一个廉价替补。


                            IP属地:江苏来自手机贴吧14楼2025-08-09 21:30
                            收起回复
                              2026-01-20 07:05:07
                              广告
                              不感兴趣
                              开通SVIP免广告
                              4.kimi,在长文本理解这一方面还是可以的,以前用它搞过论文降重,说实话也是一般般,深度思考这一块,有的时候会陷入循环,有的时候还不如不思考,新出的k2虽然万亿参数,但是感觉也像是勉强赶上了deepseek和Qwen,k2还不能深度思考,虽然开源了这个模型,但是几乎没什么人用了,给个2分。


                              IP属地:江苏来自手机贴吧15楼2025-08-09 22:10
                              收起回复