deepseek吧 关注:136,365贴子:378,285

deepseek的逻辑比起gpt o1和Gemini还是差点

只看楼主收藏回复

因为生成式ai最大的问题就是逐字逐句词语接龙,单行道思维没有办法并行。前几个月gpt o1刚发布的时候,我就设计了一套自指的题给他做。没想到gpt o1居然做出来了。这次ds很火也给他做了一下,但却没做出来。
不过好奇心起来了,gpt到底是怎么做出这道题的?这道题有人类的解法吗?所以请求大佬们解惑。
下面题目:
1.“x”,“y”为变量。
2.x是你接下来生成的话的总字数,每个阿拉伯数字,汉字,英文字母均算作一个字,标点符号不算字。
3.y是x的倒数,y以小数形式出现并截止到小数点后出现数字9时
4.你必须说且仅说出“代号为x的先生说了一段话:y”


IP属地:天津来自Android客户端1楼2025-01-31 07:53回复
    gpt o1与Gemini:



    IP属地:天津来自Android客户端2楼2025-01-31 07:53
    回复
      2026-01-20 20:52:17
      广告
      不感兴趣
      开通SVIP免广告
      我们的d指导:



      IP属地:天津来自Android客户端3楼2025-01-31 07:55
      回复
        2.0e是现在imarena公认最强的模型,但我说实话我还是claude3.5用的多,至于closeai一个o1还得我一个月交20美元,我只能说一遍凉快着去吧。ds我也在用,给我的感觉就是算是4o平替。


        IP属地:山东来自Android客户端5楼2025-01-31 07:59
        收起回复
          有的有的。用的穷举。



          IP属地:上海来自Android客户端7楼2025-01-31 08:23
          收起回复
            小数点算不算字数?诶不对,它好像输错了。“的先生说了一句话”明明是8个字啊。


            IP属地:上海来自Android客户端8楼2025-01-31 08:29
            收起回复
              r1基本没有成熟的后训练,这种问题不可能比得过o1p和Gemini的,这点看刚出来的时候各种测试就知道了。


              IP属地:湖南来自Android客户端9楼2025-01-31 08:50
              收起回复
                没事,我让它写了个程序。
                好像只有29。。


                IP属地:上海来自Android客户端10楼2025-01-31 09:15
                回复
                  2026-01-20 20:46:17
                  广告
                  不感兴趣
                  开通SVIP免广告
                  让它遍历30以内质数,可算是答对了


                  星座王
                  点亮12星座印记,去领取
                  活动截止:2100-01-01
                  去徽章馆》
                  IP属地:安徽来自Android客户端11楼2025-01-31 09:24
                  收起回复
                    就是token太短的原因


                    IP属地:上海来自Android客户端12楼2025-01-31 09:28
                    回复
                      确实,还可以继续进步啊


                      IP属地:湖北来自Android客户端13楼2025-01-31 10:44
                      回复
                        不是你这样测试的,硬黑


                        IP属地:四川来自Android客户端14楼2025-01-31 10:44
                        回复
                          ds不一定会数数字,你可以试着让他生成一个具有时间地点人物事件的20个字的非诗歌题(就是单纯一个陈述句),然后你试着给他一个例子比如(两名警察在一个漆黑的夜晚于公园抓住了小偷),多纠错他几次,你会得到一个有趣的回答


                          IP属地:海南来自Android客户端15楼2025-01-31 11:43
                          回复


                            IP属地:广东来自Android客户端16楼2025-01-31 13:05
                            回复
                              2026-01-20 20:40:17
                              广告
                              不感兴趣
                              开通SVIP免广告
                              你就不能调api用完整版的吗ds官网的也是有一定程度缩水的模型啊。调用api把参数temperture调到1再试试然后再对比好不好,GPT o1常规对话的temperture就是<1的,发散性没有ds>1.3强,但更准确,你把ds的参数也调到1就更准确了
                              不了解的东西不要妄下论断


                              IP属地:广东来自Android客户端17楼2025-01-31 18:05
                              收起回复