GPT-5.4 在专业知识工作领域的进步可以说是此次升级的最大亮点。
OpenAI 使用了一个名为 GDPval 的基准测试来衡量模型在真实职业场景中的表现,该测试覆盖了美国 GDP 贡献最大的 9 个行业、44 个职业方向,任务涵盖制作销售演示文稿、会计电子表格、医疗排班表、制造业图纸甚至短视频等各类实际工作产物。
结果非常亮眼:GPT-5.4 在 83.0% 的任务对比中达到或超越了人类行业专家水平,而 GPT-5.2 的这一数字为 70.9%。这意味着 GPT-5.4 已经在绝大多数专业工作中具备了与资深从业者相媵美甚至更优的能力。
随着AI越来越强,公司引进AI辅助工作、裁员(AI替代)、降本增效,细思极恐。










