deepseek吧 关注:129,715贴子:321,280
  • 28回复贴,共1

gemini 2.5 pro就这?失望

只看楼主收藏回复

一个简单的生活常识问题都能做错。




IP属地:江苏来自Android客户端1楼2025-03-28 09:39回复
    这就是所谓排行榜分数第一的AI?


    IP属地:江苏来自Android客户端2楼2025-03-28 09:40
    回复
      2025-08-29 20:38:43
      广告
      不感兴趣
      开通SVIP免广告
      这题典型的条件不全,因为ai不可能默认你有理想三维路径,少用这种题测ai了,你要是拿这种题做标准,文心一言吊打deepseekgemini一票ai


      IP属地:浙江来自Android客户端3楼2025-03-28 09:52
      收起回复





        IP属地:江苏来自Android客户端4楼2025-03-28 12:50
        回复
          告诉门的深度是多少


          IP属地:上海来自Android客户端5楼2025-03-28 12:55
          收起回复
            grok3没有问题


            IP属地:湖南来自Android客户端6楼2025-03-28 13:42
            回复





              IP属地:江苏来自Android客户端7楼2025-03-28 13:51
              回复
                +3


                IP属地:福建来自iPhone客户端8楼2025-03-28 13:54
                回复
                  2025-08-29 20:32:43
                  广告
                  不感兴趣
                  开通SVIP免广告
                  绝了,之前有人用这道题车deepseek,最后验证是ai都必须给完整明确的三维路径才会判定通过,gemini2.0也符合这个结论,我下意识地觉得gemini2.5也是这样
                  结果gemini2.5我是真的拼尽全力无法让它通过


                  IP属地:浙江9楼2025-03-28 13:57
                  收起回复
                    这个问题我测试下来好多大体量的模型都翻车了,反倒是一些小模型直接理解了,就很神奇


                    IP属地:上海来自Android客户端10楼2025-03-28 16:37
                    回复


                      IP属地:辽宁11楼2025-03-28 16:39
                      收起回复
                        3


                        IP属地:山东来自Android客户端12楼2025-03-28 18:07
                        收起回复