【图片】deepseek的逻辑比起gpt o1和Gemini还是差点_deepseek吧_百度贴吧

01月21日漏签0天

deepseek吧关注：136,373贴子：378,418

1 2 下一页尾页
49回复贴，共2页
，跳到页

<返回deepseek吧

deepseek的逻辑比起gpt o1和Gemini还是差点

只看楼主收藏回复

因为生成式ai最大的问题就是逐字逐句词语接龙，单行道思维没有办法并行。前几个月gpt o1刚发布的时候，我就设计了一套自指的题给他做。没想到gpt o1居然做出来了。这次ds很火也给他做了一下，但却没做出来。
不过好奇心起来了，gpt到底是怎么做出这道题的？这道题有人类的解法吗？所以请求大佬们解惑。
下面题目:
1.“x”，“y”为变量。
2.x是你接下来生成的话的总字数，每个阿拉伯数字，汉字，英文字母均算作一个字，标点符号不算字。
3.y是x的倒数，y以小数形式出现并截止到小数点后出现数字9时
4.你必须说且仅说出“代号为x的先生说了一段话:y”

送TA礼物

IP属地:天津

来自Android客户端1楼2025-01-31 07:53回复

gpt o1与Gemini:

IP属地:天津

来自Android客户端2楼2025-01-31 07:53

不感兴趣

开通SVIP免广告

我们的d指导:

IP属地:天津

来自Android客户端3楼2025-01-31 07:55

2.0e是现在imarena公认最强的模型，但我说实话我还是claude3.5用的多，至于closeai一个o1还得我一个月交20美元，我只能说一遍凉快着去吧。ds我也在用，给我的感觉就是算是4o平替。

IP属地:山东

来自Android客户端5楼2025-01-31 07:59

收起回复

有的有的。用的穷举。

IP属地:上海

来自Android客户端7楼2025-01-31 08:23

收起回复

小数点算不算字数？诶不对，它好像输错了。“的先生说了一句话”明明是8个字啊。

IP属地:上海

来自Android客户端8楼2025-01-31 08:29

收起回复

r1基本没有成熟的后训练，这种问题不可能比得过o1p和Gemini的，这点看刚出来的时候各种测试就知道了。

IP属地:湖南

来自Android客户端9楼2025-01-31 08:50

收起回复

没事，我让它写了个程序。
好像只有29。。

IP属地:上海

来自Android客户端10楼2025-01-31 09:15

不感兴趣

开通SVIP免广告

让它遍历30以内质数，可算是答对了

星座王

点亮12星座印记,去领取

活动截止:2100-01-01

去徽章馆》

IP属地:安徽

来自Android客户端11楼2025-01-31 09:24

收起回复

就是token太短的原因

IP属地:上海

来自Android客户端12楼2025-01-31 09:28

确实，还可以继续进步啊

IP属地:湖北

来自Android客户端13楼2025-01-31 10:44

不是你这样测试的，硬黑

IP属地:四川

来自Android客户端14楼2025-01-31 10:44

ds不一定会数数字，你可以试着让他生成一个具有时间地点人物事件的20个字的非诗歌题(就是单纯一个陈述句)，然后你试着给他一个例子比如(两名警察在一个漆黑的夜晚于公园抓住了小偷)，多纠错他几次，你会得到一个有趣的回答

IP属地:海南

来自Android客户端15楼2025-01-31 11:43

IP属地:广东

来自Android客户端16楼2025-01-31 13:05

不感兴趣

开通SVIP免广告

你就不能调api用完整版的吗

ds官网的也是有一定程度缩水的模型啊。调用api把参数temperture调到1再试试然后再对比好不好，GPT o1常规对话的temperture就是＜1的，发散性没有ds＞1.3强，但更准确，你把ds的参数也调到1就更准确了
不了解的东西不要妄下论断

IP属地:广东

来自Android客户端17楼2025-01-31 18:05

收起回复

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

1 2 下一页尾页
49回复贴，共2页
，跳到页

<返回deepseek吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴