我发常用的大模型，大伙来打分【deepseek吧】

01月20日漏签0天

deepseek吧关注：136,344贴子：378,026

1 2 3 下一页尾页
215回复贴，共3页
，跳到页

<返回deepseek吧

我发常用的大模型，大伙来打分

只看楼主收藏回复

如题，这里的范围是指现阶段主流的大语言模型（排除掉画图模型，视频模型之类的），有些楼主没有体验过的就不给予评价。
5：神中神
4：稳定好用，几乎没有什么短板
3：一般般
2：路边一条
1：拉爆了
deepseek镇楼

送TA礼物

IP属地:江苏

来自手机贴吧1楼2025-08-09 19:58回复

1.chatgpt，作为从23年用到现在的老用户，刚出来的时候5，毕竟从GPT3.5到GPT4是巨大的提升，特别是中文语义上的理解，后来会根据IP降智3，纯纯的恶心用户，从去年九月份发出的o1preview到正式版将近等了半年，sora也是从去年春预告，等了一年才发布。要不是因为deepseek半路杀出，我估计GPT5现在都不一定发布。但是这个暑假发的东西挺多的，开源的oss，agent，GPT5（免费用户一天可以用40次大概），综合下来给个四分。

IP属地:江苏

来自手机贴吧2楼2025-08-09 20:03

收起回复

不感兴趣

开通SVIP免广告

2.gemini，这个无需多言5。免费可用的API，虽然中途收回过2.5pro，但是还是在六月底加回来了。从三月份霸榜到现在，学生认证还能免费使用15个月的pro会员。我现在基本上将gemini当Google搜索使了。Google也是逼迫openai发出了GPT5。

IP属地:江苏

来自手机贴吧3楼2025-08-09 20:06

收起回复

3.Claude，编程利器，但是在其他方面（比如说解题）并不特别出彩，在安全方面上，anthropic下足了功夫，现在发了opus4.1，边城还是稳居第一，但是GPT5，gemini也不差，算的是那一种有特长，但是其他的都比较平庸，而现在，这个特长也不算很长了，综合来看给到4。

IP属地:江苏

来自手机贴吧4楼2025-08-09 20:09

收起回复

4.grok，我是从grok2开始用的，当时好像还送25美元的API ，说实话，也是一般般给到3，后来grok3的时候号称地表最强，用起来感觉也就比deepseek r1快一点，但是它的优势是没有审查，毕竟是用Twitter上的数据训练的，刚出的grok4没充会员，不给予评价，但是在群听说有那个ai女友，尺度很大，看来老马有意向将grok往r18引。综合评价来看，日常使用3，角色扮演5（不用破甲）。

IP属地:江苏

来自手机贴吧5楼2025-08-09 20:14

收起回复

5.llama，毕竟是在四月份的时候开源了llama4，所以我给到这个席位，虽然这个模型是跑分模型，实际体验很差，但是去年的时候，llama3.1 405b是可以硬刚当时的chatgpt4o的存在。llama3系列在开源方面算得上是一个很强的模型，而且meta又从openai那边挖了几个核心人才，外界消息说下一个模型不一定开源了。综合来看给一个3。

IP属地:江苏

来自手机贴吧6楼2025-08-09 20:18

收起回复

6.copilot，这个是内嵌在office里面，当时好像是chatgpt4o的套壳，体验效果还是可以的，就是环大陆，可惜现在Microsoft和openai不合作了，我估计能用到的场景，也就是辅助写作之类的。给个2~3分。

IP属地:江苏

来自手机贴吧7楼2025-08-09 20:20

收起回复

国内这边，1.deepseek，作为年初杀出的黑马，可以硬刚chatgpt o1的存在，这个可以给到5，对于我而言，它的意义就是将成本打下来。反正，当时深度思考这一块，国内就没有模型能比得上chatgpt。deepseek对于我而言，最大的意义就是量大管饱，API充了几十块钱，现在都还没用完。出了0528模型之后把幻觉降了一些，但是还是没有多模态。毕竟当时deepseek的优势就是免费，便宜的API，开源，但是现在这些优势都不存在了，免费的国产模型追了上来，Google有教育优惠，免费的API，openai开源了oss（虽然跑分虚高，但是我体验下来，20B的模型相当于o4mini），但是用户还是在的，周围朋友都在用，综合下来给个4分

IP属地:江苏

来自手机贴吧8楼2025-08-09 20:27

收起回复

不感兴趣

开通SVIP免广告

歇一会儿，等会再写

IP属地:江苏

来自手机贴吧9楼2025-08-09 20:27

淡季贴吧

IP属地:江苏

来自手机贴吧10楼2025-08-09 20:40

忘了叠甲了，楼主评价纯属主观臆断，若有异同，都以你们的观点为主

IP属地:江苏

来自手机贴吧11楼2025-08-09 20:48

2.豆包，破了限之后写小说的话算可以，并没有什么明显的像deepseek一样的玄幻风幻觉，但是在有的时候就特别唐，更别说在deepseek开源之前没有深度思考了，特长就是在生成图片和视频这方面还是很不错的，但可惜这不是本帖的重点。在聊天这一方面，我只能给到2~3分。（附上梗图）

IP属地:江苏

来自手机贴吧12楼2025-08-09 21:15

收起回复

3.Qwen，作为中文大语言模型开源的神，在deepseek开源之前可以算得上是no.1，在社区方面有魔搭，开源的模型类型也很丰富，楼主是从qwen2用到现在，没有优势，也没有短板，中规中矩，但是最近开源的qwen3跑分虚高，在代码方面也不是像之前在国产中名列前茅了，尝试了几个项目之后，我感觉不如deepseek（Qwen3 coder），最近发布的Qwen coder效果也不太好。

IP属地:江苏

来自手机贴吧13楼2025-08-09 21:23

收起回复

Qwen补充：它在4月的时候出了一个深度研究和类似agent的功能，楼主体验过深度研究，论深度不如GPT（至少chatgpt在搜索之前会给出五个提问点拓展），论广度不如grok3（r18的内容也可以搜索）所以我觉得这个只是一个廉价替补。

IP属地:江苏

来自手机贴吧14楼2025-08-09 21:30

收起回复

不感兴趣

开通SVIP免广告

4.kimi，在长文本理解这一方面还是可以的，以前用它搞过论文降重，说实话也是一般般，深度思考这一块，有的时候会陷入循环，有的时候还不如不思考，新出的k2虽然万亿参数，但是感觉也像是勉强赶上了deepseek和Qwen，k2还不能深度思考，虽然开源了这个模型，但是几乎没什么人用了，给个2分。

IP属地:江苏

来自手机贴吧15楼2025-08-09 22:10

收起回复

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

1 2 3 下一页尾页
215回复贴，共3页
，跳到页

<返回deepseek吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

我发常用的大模型，大伙来打分

登录百度账号

扫二维码下载贴吧客户端