deepseek吧 关注:136,770贴子:383,280

回复:市面上具有代表性的22款模型深度测评

只看楼主收藏回复



IP属地:陕西49楼2025-02-20 12:03
回复


    IP属地:陕西50楼2025-02-20 12:05
    回复
      2026-02-07 23:58:18
      广告
      不感兴趣
      开通SVIP免广告

      设置主观题是真的给自己找事哦,一堆作文难改的一批。


      IP属地:陕西51楼2025-02-20 12:07
      回复
        大概总结一下
        首先是最贵的,GPT-o1不建议用API,会员可以偶尔用一下,要是充钱调用API是真的贵,买不起啊。而且GPT-o1没有断崖式的某方面领先,不配这个价格。


        IP属地:陕西52楼2025-02-20 12:10
        收起回复
          Gemini是个标准的文科生,生成各种文章,翻译这种东西的时候,非常强。
          价格其实不算贵,别看r1的16元是最低的,它思考可费token了,Gemini2.0只贵了一倍,写东西的时候用这个还是很划算的


          IP属地:陕西53楼2025-02-20 12:14
          回复
            代码上,gpt-o3mini 感觉是最强的,o1可能很强我不敢用,太贵了。但是其实大家都挺强的,每家模型有每家的容易出的Bug,让他们互相找bug才是正确用法。
            r1经常思考太多,过度思考写出运行不了的。建议把温度参数调成0


            IP属地:陕西54楼2025-02-20 12:16
            回复
              r1非常非常偏科,推理能力断崖式领先,生成方面你要是写点猫娘啊啥的不打紧,真正的有用的文章写不了一点,完全不按你的要求来,脑子里全是自己的想法。
              最喜欢奇奇怪怪的比喻和量子力学。


              IP属地:陕西来自Android客户端55楼2025-02-20 12:20
              回复
                claude感觉有些过时了,优势不是很大。这个模型正处于青黄不接的时候,新旗舰模型还没出,老旗舰已经有点老了。sonnet其实不是旗舰模型,opus才是,不过opus已经有些老了。不过作为曾经冲过会员的忠实用户,个人体验,它是最能理解用户隐藏需求的模型,有时候跟他随便聊聊天什么的,尺度拿捏的非常到位,像是你肚子里的蛔虫。


                IP属地:陕西来自Android客户端56楼2025-02-20 12:23
                回复
                  2026-02-07 23:52:18
                  广告
                  不感兴趣
                  开通SVIP免广告
                  请问chatgpt4o的api有什么推荐的吗?


                  IP属地:海南来自Android客户端57楼2025-02-20 12:26
                  收起回复
                    翻译方面,gemini一如既往的强,翻译重要的东西可以用这个。
                    嫌gemini贵的话可以用v3,效果也很不错。
                    翻译网页的话可以用沉浸式翻译插件加豆包2.5 lite,效果过得去的同时非常非常便宜。
                    再低就不介意了,豆包已经非常非常便宜了。


                    IP属地:陕西来自Android客户端58楼2025-02-20 12:26
                    收起回复
                      豆包和千问的pk,个人感觉这几组里豆包都略胜一筹。不过也不好说,测试的量还是太少,没有拉开差距。


                      IP属地:陕西来自Android客户端59楼2025-02-20 12:29
                      回复
                        太牛了大佬,实践出真知


                        IP属地:浙江来自Android客户端60楼2025-02-20 12:32
                        回复
                          Deepseek的蒸馏模型,不建议本地部署。除非你能部署32b以上的版本,才能勉强0.6元/百万token的轻量级模型pk,一年都不一定能省几块钱。


                          IP属地:陕西来自Android客户端61楼2025-02-20 12:33
                          回复
                            然后再推荐一下这两个视觉模型,这俩模型的语言能力是够用的,拍个题搜索啥的,当个小猿搜题的平替很不错的。


                            IP属地:陕西来自Android客户端62楼2025-02-20 12:34
                            收起回复
                              2026-02-07 23:46:18
                              广告
                              不感兴趣
                              开通SVIP免广告
                              很全面的评测了,比某视频网站上一堆营销号要强多了


                              IP属地:黑龙江来自iPhone客户端63楼2025-02-20 13:06
                              回复