开yun体育网这意味着严格守秘的题目-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口

发布日期:2025-07-21 03:52    点击次数:59

开yun体育网这意味着严格守秘的题目-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口

OpenAI o3 还没上线开yun体育网,就被曝数学收货是靠舞弊得来?!

Benchmark 发布机构里面东谈主员爆料称,OpenAI 给了他们经费赞成。

就连包括陶哲轩在内参与出题的 60 余名数学家,在音信曝光之前也王人和正常公众同样蒙在饱读里。

直到 o3 发布,这一音信才被公开。这意味着严格守秘的题目,OpenAI 提前拿到了手中。

这套数据集名叫FrontierMath,包含了由陶哲轩等 60 多名泰斗数学家命制的高难度题目。

陶哲轩就默示,这些题目迷漫困扰 AI 几年的技术;1998 年菲尔斯奖得主 Gowers 也说,能处理其中的一个问题就照旧卓越当今的能力限度了。

其时也恰是因为在这一测试基准上大幅高出,o3 的能力更进一步被得到招供。

Epoch.ai 这边,伙同首创东谈主 Tamay Besiroglu 也讲述并承认了精巧赞成和 OpenAI 提前拿到题方向神话,但否定题目被 OpenAI 拿来舞弊。

但有些网友并不买账,默示 OpenAI 淌若不使用这些信息还要造访权限干什么,并推测有可能被用来熟习。

人人被条款严格守秘,但 OpenAI 却能拿到题

这家名叫 Epoch.ai 的机构,设置了一款名为 FrontierMath 的数学测试基准,论文初版预印本于旧年 11 月 7 日(和解寰球时,北京技术为 8 日凌晨)发布。

包括初版在内,FrontierMath 的论文在近两个月的技术里一共发布了五个版块,但直到临了 12 月 20 日的第五版才表示了 OpenAI 的资助。

不外也仅仅在脚注中提了一句,感谢 OpenAI 对构建 Benchmark 的撑抓。

况兼 12 月 20 日刚好是 OpenAI 发布 o3 的日子,况兼 Besiroglu 也深远,之前莫得公开恰是由于OpenAI 的守隐秘求:

在 o3 推出之前,咱们一直被放手表示合营联系,过后看来,咱们应该愈加勤奋地商量,以便粗略尽快向基准孝敬者保抓透明。

淌若不看 OpenAI 这场风云,FrontierMath 是一套含金量颠倒高的测试基准,由大众六十余位数学家联手命题,包括素质、IMO 命题东谈主、菲尔兹奖得到者,其中就有大牛陶哲轩等东谈主。

而且难度也颠倒高,包括数百个极具挑战性的数常识题,在 o3 之前的模子处理率不到 2%。

哪怕 o3 确凿作了弊,得分也才 20 多分。

像底下的这谈题目,在 FrontierMath 当中算是难度最低的一档:

正常来说,FrontierMath 里的题目和谜底是严格守秘的,就连出题的数学家也被条款订立守秘公约,以致不可使用 Overleaf、Colab 或电子邮件传输关联题方向信息。

调侃的是,这么"严格守秘"的题目却被 OpenAI 拿到,而出题人人对 OpenAI 的情况绝不知情。

斯坦福博士、MIT 罗德奖学金得主 Carina Hong(洪乐潼)就默示,至少有六名人人粗略阐明这少许,况兼大部分人人默示不笃定淌若知谈(OpenAI 的独家造访权)是否还会选拔孝敬。

自后她默示,(和出题东谈主)签守秘公约照实是为了谨防数据浑浊,对 OpenAI 的方向则不作念忖度。

联创承认空虚,但否定 OpenAI 舞弊

里面爆料和外部质疑之下,Epoch.ai 联创 Besiroglu 也承认了和 OpenAI 存在精巧公约,并默示莫得公开透明照实是"犯了一个空虚"。

但 Epoch.ai 否定了 OpenAI 舞弊的说法,默示一方面OpenAI 拿到的数据并不是一谈,另一方面OpenAI 也理论甘心拿到的数据不会用于模子熟习。

Besiroglu 讲述全文如下(汉文为机翻):

但关于 Besiroglu 提到的"理论甘心",有网友默示至少要有个书面的公约,但忖度 OpenAI 不会欢欣提供,还有东谈主补充说哪怕有书面材料也很难监督实际。

不外到当今,照实是总计的讲述王人来自 Epoch.ai 这边,OpenAI 还没给出说明。

另外 Epoch.ai 首席数学家Ellot Glazer也甘心,之后会对受到的资助进行说明。

关于 o3 的收货,Ellot 默示 Epoch.ai 无法给出甘心,但他个东谈主深信 OpenAI 的讲述是准确的,因为在他看来 OpenAI "莫得撒谎的动机"。

同期他说 Epoch.ai 正在设置一个保留数据集,粗略确保 OpenAI 在测试之前无法预先战役。

不外有网友对"莫得动机"的说法默示怀疑,Ellot 也进行了说明,默示 OpenAI 莫得傻到搬起石头砸我方的脚。

话又说记忆,o3 到当今依然是个黑盒,到底是名副其实如故炒作噱头,比及发布的那天就揭晓谜底了。

参考贯穿:

[ 1 ] https://www.lesswrong.com/posts/cu2E8wgmbdZbqeWqb/meemi-s-shortform

[ 2 ] https://techcrunch.com/2025/01/19/ai-benchmarking-organization-criticized-for-waiting-to-disclose-funding-from-openai/

[ 3 ] https://www.reddit.com/r/singularity/comments/1i4n0r5/this_is_so_disappointing_epoch_ai_the_startup/

[ 4 ] https://x.com/CarinaLHong/status/1880820323597357273开yun体育网



栏目分类



Powered by 开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口 @2013-2022 RSS地图 HTML地图