News

Guangdong BAIDU Special Cement Building Materials Co.,Ltd
— 新闻中心 —

Openai的新型神秘模特赢得了IMO 2025金牌,并征服了

Openai一般推理的神秘模型是否真的克服了2025年IMO并获得黄金的五个困难问题?这一消息导致格雷格·布罗克曼(Greg Brockman)和其他大人物变得热情地变得。换句话说,歌剧可能已经开发出一种破坏性推理的技术,向摇篮道别。还有其他爆炸新闻:GPT-5也来了。就在昨天,世界上最好的模特在2025年的Omi Field中被删除了,甚至没有触及铜牌的边缘。但是现在Openai丢了一枚炸弹:他们以新的“通用推理模式”获得了2025年IMO的金牌!解决6个问题,5个问题,并赢得35分!如您所知,最好的Gemini 2.5 Pro性能也只能获得13分。 Lianchuang Greg Brockman,首席亚历山大·魏(Alexander Wei)和几位Openai研究人员热情地介绍了这个里程碑的结果!作为回应,德国人的父亲诺姆·布朗(Norm Brown)宣布,这一成就的重要性超过了“我认为征服AI”。消息发生后,整个硅谷都非常兴奋!人们推测,这次Openai本可以发起破坏性推理的技术,他们完全说了传统的摇篮思维链。这不仅是模型的胜利,而且是新时代的开始!更令人震惊的是,歌剧已经宣布这种历史模型是一种新的实验模型,而不是传闻中的GPT-5。而且该模型根本没有启动,这太神秘了!赢得IMO金牌,亚历山大·韦(Alexander Wey)和他的团队的神秘模特将使该模型在与人类相同的条件下完全竞争。仅基于两个4.5小时的考试期间编写自然语言的完整证明过程,而没有工具和理解问题。然后,他们将被IMO奖章的三名前加纳德斯(Ganendors)严格授予资格。最后,该模型以35/42的高分达到了黄金水平。相反,是否它是赋予的,或者是另一个复杂的任务,离开,如果我想赢得胜利,他们经常不得不在特定领域接受特殊培训。但是这次Openai打破了这一铁规则:新模型不仅特别由IMO提供,而且还可以考虑数小时。相反,我们知道的O1模型是在几分钟内计算得很好的,并且计算了深厚的创造性思维能力。关于高于先前参考点的创造性思维水平之间的范围,GSM8K(高级人类约为0.1分钟)→数学基准(约1分钟)→AIME(大约10分钟)→IMO(大约10分钟)。其次,IMO演示文稿是难以参与的几个页面测试。该领域的进步必须超越强化学习范式,并获得明确可验证的回报。为此,OpenAI研究团队获得了一个模型,该模型可以在人类数学家。此外,该模型没有通过培训“特定任务(OMI)”来实现这种能力,而是在测试期间的增加和计算机扩展方面取得了新的进步。那么,O3-Alpha是否仅暴露了以前的游戏?事实证明,这是歌剧真正保留的最好的动作!如果您对完整的解决问题过程感兴趣,可以看到Openai发表的IMO 2025竞赛问题的答案。该模型解决了第一个问题(P1-P5),但无法解决第六个问题(P6)。正如谣言所说,这次第六个问题非常困难,世界各地只有六个人解决了问题。仓库地址:https://github.com/aw31/openai-imo-2025-Profforn/blob/main/readme.md,我们将研究前五个问题的新模型的特定问题解决过程。第一个问题是分析几何问题。你会看到的回答这个问题的关键点是找到涵盖点和可能的阳光数量的N线。该模型使用一种独特的方法来确定符合标准的所有非负整数。引理:如果n≥4,覆盖p_n的线n是三个,则使用正方形的末端。对n = 3个情况进行精确分析。对于一般n≥3,已经显示每个n的k = 0、1、3的配置。使用座右铭减少来实现主要结论的测试。第二个问题是关于平坦的几何形状。示意图如下:在已发布的响应中,很难直接证明一条经过点H并平行于AP缠结的线路缠结的线。但是,可以用不同的语句替换此问题。将X定义为包含B的EF的中点。如果我们可以证明HX是Parallel到ef。另一方面,该线的切线必须在中点接触圆圈。因此,足以证明这两个点。在证明过程中,完全四个步骤模型:配置和参数分析。令P为三角形ACD的外部中心。连接AP和两个圆圈ω和γ的交点分别为E和F点。找到通过B,E和F的圆周圆的方程。第三个问题是一个函数问题。在人类玩家的解决方案中,此Pregunta的关键是在下面的照片中尝试黄色。该模型对此问题的解决方案分为四个步骤:考虑类型Blogger的函数,即满足P_F属性的函数。如果一个函数对特定质数的值大于1,请考虑在模块化素数方向上达成协议。推理:如果奇数表弟的数字符合F 1,则整个F函数必须是标识函数。输入主要的座右铭结构。在非相同功能的情况下,分析功能的结构。第四个问题是数字理论的问题。解决问题的重要步骤可能会成为以下格式:在响应模型的过程中采用了类似的想法。第五个问题研究了游戏理论。解决此问题的解决方案包括三个部分:在解决问题过程中,我们将讨论三种情况:如果λ≥C(没有防御),爱丽丝将总是获胜。当是λc时,爱丽丝赢了。对于λc(C = 1/√2),Bazza获胜。第六个问题包括图形组合数学。只有六名人类参赛者可以使这个问题感知到。六个出色的型号,即O3,O4-Mini,Gemini 2.5 Pro,Grok-4和DeepSeek-R1,也得分为零。甚至Openai Supermodels都失败了。目前,世界上没有一个很好的模型可以解决第六个问题。亚历山大的复活节彩蛋当他宣布新闻时,“草莓”的形象塞满了。 “草莓”是OpenAI在内部开发过程中使用的代码名称。这用于推广新的推理模型项目,即当前熟悉的系列“或”模型。作者介绍Alex Way是一位OpenAI研究科学家,其重要的研究讲述了有关大型和推理语言模型的重要研究。他还研究了自动学习,游戏理论和算法的交集。他从哈佛大学的Bajo Nika Hagutalab,Michael I. Jordan和Jelani Nelson和Scott Cominers获得了计算机科学博士学位。他是公平团队的成员,并参与了第一个到达外交游戏中人类级别的人工智能的建设。结果于2022年发表。参考文献:https://x.com/alexwei_/status/1946447777777428555555555555532918本文可以在微信中找到公共帐户:Xinzhiyuan(ID:AI_ERA)
Tel
Mail
Map
Share
Contact