网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
02月08日
漏签
0
天
deepseek吧
关注:
136,775
贴子:
383,295
看贴
图片
吧主推荐
游戏
首页
上一页
1
2
3
4
5
6
7
8
下一页
尾页
225
回复贴,共
8
页
,跳到
页
确定
<返回deepseek吧
>0< 加载中...
回复:市面上具有代表性的22款模型深度测评
只看楼主
收藏
回复
中叶彩梓
上尉
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
大佬厉害的
IP属地:广西
来自
iPhone客户端
34楼
2025-02-19 19:54
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
这题也看个乐子,脑筋急转弯,人都不一定能答对。
不过也能看出来,deepseek r1的推理能力真强,70B模型都可以猜到
IP属地:陕西
35楼
2025-02-19 20:59
回复(2)
收起回复
2026-02-08 05:06:58
广告
不感兴趣
开通SVIP免广告
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
数学推理能力测试。
这一题o1消耗了我6美元的token,结果啥都没输出。我还专门充值了一个网站按回答次数收费,然后o1还是答不出来。服了。
claude计算精度比较差了,应该是因为模型很久没出新的了。
deepseek计算精度非常在线。
豆包计算精度也很高。
IP属地:陕西
36楼
2025-02-19 21:02
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
上一题要用牛顿迭代法做,大家做的都还可。
豆包感觉对这种问题蛮擅长的,加上豆包的视觉模型很强,可以平替小猿搜题了,初高中题给你整的明明白白
IP属地:陕西
37楼
2025-02-19 21:04
回复(1)
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
本来想出个简单题,别太难为轻量级模型了,结果没想到,现在模型这么强,全答对了。
IP属地:陕西
38楼
2025-02-19 21:06
回复(2)
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
1.5B模型能算请牛顿迭代法,就很逆天。要知道这玩意儿话都说不清,让他生成文章给我一堆乱码,结果数学题做的贼6。
deepseek系列严重偏科啊。
IP属地:陕西
39楼
2025-02-19 21:07
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
deepseek-r1-1.5B,我愿称之为模型界的边牧。
智商在线,但不会说话。写文章写出来一堆乱码,但是写数学能算清牛顿迭代法,我真是服了。
不过边牧到底不是人,智商虽然可以,也是和狗比的,没什么实用价值。
IP属地:陕西
40楼
2025-02-19 21:10
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
这题测试知识储备的。
又到了deepseek 1.5B的高光时刻了,话都说不清,硬是推导出了科里奥利力的存在,十分逆天。
IP属地:陕西
41楼
2025-02-19 21:12
回复(3)
收起回复
2026-02-08 05:00:58
广告
不感兴趣
开通SVIP免广告
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
这题评价麻烦的要死,直接给分吧。
deepseek-r1的高光时刻,效果断崖式领先,不愧是推理模型
IP属地:陕西
42楼
2025-02-19 21:15
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
作诗题
IP属地:陕西
43楼
2025-02-19 21:29
回复
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
我这文学素养一般,看着差不多就给满分了。分数不满都是明显有缺点的,大家自己看吧
IP属地:陕西
44楼
2025-02-19 21:31
回复(4)
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
写作题deepseek是真的不擅长,非常爱脑补,幻觉很严重。gemini对这种题就非常擅长。
IP属地:陕西
45楼
2025-02-19 21:32
回复(2)
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
个人认为Gemini是文章写的最好的,你看这写的,看着内容很充实,结合题目一看确实啥都没干,不会给你瞎编写有的没的凑数。
IP属地:陕西
46楼
2025-02-19 21:36
回复(1)
收起回复
社會主义好
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
这题的评测是真费劲,翻译最强的也是Gemini,deepseek也很擅长翻译,推理模型会去思考用什么单词合适。
评分我是用旗舰组的AI看了选手的翻译和我的评分标准之后,让他们相互讨论出来,本人的英语水平实在有限
以下是Gemini的翻译
IP属地:陕西
47楼
2025-02-19 21:49
回复
收起回复
2026-02-08 04:54:58
广告
不感兴趣
开通SVIP免广告
爱德华E98
上尉
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
这么一看ds偏科严重
不过1.5B这么离谱的吗,我之前用了一下这些蒸馏模型,一直到32B才能勉强把话说利索
IP属地:湖南
来自
Android客户端
48楼
2025-02-19 23:56
回复(4)
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
游戏账号狂氪金!爱泼斯坦诈尸?
1639770
2
中式智慧!鸡蛋革命论启发老美
1613792
3
幽默老日阴阳白皮吃人肉
1424164
4
难绷!爱泼斯坦文件惊现孔子
1249047
5
吧友晒工资,一年竟赚这么多
907790
6
抽象,军火商用卷尺量歼35模型
844975
7
贴脸歧视,川普辱奥巴马拒道歉
659448
8
曼联连斩四场,热刺少人难招架
500779
9
连输外协,林诗栋主场不敌户上
459250
10
坦白负债求支援,遭爹妈打脸
365022
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示