deepseek吧 关注:134,582贴子:363,104
  • 27回复贴,共1

gemini 2.5 pro就这?失望

只看楼主收藏回复

一个简单的生活常识问题都能做错。




IP属地:江苏来自Android客户端1楼2025-03-28 09:39回复
    这就是所谓排行榜分数第一的AI?


    IP属地:江苏来自Android客户端2楼2025-03-28 09:40
    回复
      2025-12-11 11:03:32
      广告
      不感兴趣
      开通SVIP免广告
      这题典型的条件不全,因为ai不可能默认你有理想三维路径,少用这种题测ai了,你要是拿这种题做标准,文心一言吊打deepseekgemini一票ai


      IP属地:浙江来自Android客户端3楼2025-03-28 09:52
      收起回复





        IP属地:江苏来自Android客户端4楼2025-03-28 12:50
        回复
          告诉门的深度是多少


          IP属地:上海来自Android客户端5楼2025-03-28 12:55
          收起回复





            IP属地:江苏来自Android客户端7楼2025-03-28 13:51
            回复
              +3


              IP属地:福建来自iPhone客户端8楼2025-03-28 13:54
              回复
                绝了,之前有人用这道题车deepseek,最后验证是ai都必须给完整明确的三维路径才会判定通过,gemini2.0也符合这个结论,我下意识地觉得gemini2.5也是这样
                结果gemini2.5我是真的拼尽全力无法让它通过


                IP属地:浙江9楼2025-03-28 13:57
                收起回复
                  2025-12-11 10:57:32
                  广告
                  不感兴趣
                  开通SVIP免广告
                  这个问题我测试下来好多大体量的模型都翻车了,反倒是一些小模型直接理解了,就很神奇


                  IP属地:湖北来自Android客户端10楼2025-03-28 16:37
                  回复


                    IP属地:辽宁11楼2025-03-28 16:39
                    收起回复
                      3


                      IP属地:山东来自Android客户端12楼2025-03-28 18:07
                      收起回复