OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-03
开盘:美股周五低开 市场关注特朗普新关税与就业报告后续反转来了 国家外汇管理局:推动银行外汇展业改革扩面提质 澳弘电子:公司不存在逾期担保的情况 宗庆后委托宗馥莉设立3个境外信托,专家:宗馥莉尚未最终败诉最新报道 官方通报来了 中小银行跨区域展业“冲动”科技水平又一个里程碑 菜鸟出售亏损业务,申通快递拟3.62亿元收购丹鸟物流 德邦科技:7月份未回购公司股份 早盘:道指下跌660点 纳指下跌2.2%是真的? 直击CJ|TCL科技高级副总裁赵军:未来几年,中尺寸OLED将成产业级重大机会学习了 娃哈哈“争产”官司内幕:宗馥莉受托设21亿美元信托但迟迟未推进 完美电竞合作伙伴联盟成立 共拓电竞生态圈反转来了 后续反转 直击CJ|TCL科技高级副总裁赵军:未来几年,中尺寸OLED将成产业级重大机会官方已经证实 “两房”涨超15%!报道:特朗普推进房利美和房地美私有化,召集华尔街高管献策这么做真的好么? 美国7月份制造业采购经理指数报49.8 初步数据为49.5最新报道 美国就业增长停滞:7月仅新增7.3万个就业岗位,近期数据还出现 “惊人” 向下修正 海鸥股份:7月份累计回购股份602400股 香港法院要求宗馥莉保全18亿美元信托,三子女证据曝光 300264,筹划控制权变更!停牌! 美股“混乱一周”,高盛对冲基金主管:很多结果已揭晓,但问题比答案更多这么做真的好么? 奔驰女司机冒用丈夫执法证如何处理?二级消防士是什么等级?后续会怎么发展 特朗普关税令瑞士投资者震惊,等待周一市场开盘 特朗普关税令瑞士投资者震惊,等待周一市场开盘 A股突发!刚当上董事长,就干这事!监管出手了是真的吗? 关税令客户不安,华尔街银行在欧洲失势 8月A股解禁规模超5000亿,芯片头部公司占比高 高温黄色预警继续 未来一周陕川渝鄂部分地区可达40℃学习了 惠民保变革:差异化定价众口难调,衔接商保创新药目录有“时差” 华为智慧屏4 75英寸240Hz高刷游戏电视促销太强大了 健盛集团累计回购516万股,金额4776万元 期市晨昏线8.1(晚):持续回归现实,工业硅跌破支撑这么做真的好么? 元道通信财报造假被立案,已有大批投资者参与维权是真的? 野村证券:将联想评级上调至“买入 ” 目标价至14港元 回天新材创始人章锋股权遭法拍,前妻接盘稳住控股权秒懂 恒润股份已回购372万股 金额5000万元后续反转 日元大跌引日本财务大臣担忧,跌穿155关口或引发干预?是真的? 回天新材创始人章锋股权遭法拍,前妻接盘稳住控股权是真的吗? 小米应用商店与字节扣子达成合作 打通智能体一键发布能力专家已经证实 直击CJ|不播游戏只走秀?IGG超大展台用于模特走秀,仅小块区域展示游戏这么做真的好么? 瑞银:重申康方生物“买入”评级 目标价升至197.5港元又一个里程碑 学习了 诺和诺德股价触及四年低点,特朗普敦促美国降低药价太强大了 日元大跌引日本财务大臣担忧,跌穿155关口或引发干预?后续反转来了 回天新材创始人章锋股权遭法拍,前妻接盘稳住控股权实时报道 回天新材创始人章锋股权遭法拍,前妻接盘稳住控股权官方已经证实 直击CJ|完美世界现场直播CSGO,观众直呼“太过瘾”官方通报来了

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章