大模型模型取得国际奥数竞赛金牌级成绩
【导语】近日,谷歌深度思维公司与美国OpenAI公司在国际数学奥林匹克竞赛(IMO)中取得重大突破,其AI模型首次荣获金牌级成绩。这一进展标志着AI系统在数学推理能力上的显著提升,引发学术界广泛关注。两大团队均采用自然语言处理技术,但技术细节各有特色。尽管这一成就令人振奋,但专家呼吁需有更多可复现的研究数据来支撑相关结论。
据英国《新科学家》杂志网站22日报道,谷歌旗下深度思维公司和美国OpenAI公司相继宣称,其AI模型在近日举行的国际数学奥林匹克竞赛(IMO)中,首次取得金牌级成绩。
IMO一直被研究人员视为AI系统数学推理能力的试金石。去年,深度思维公司宣布,其开发的数学推理AI模型“阿尔法证明”和几何求解AI模型“阿尔法几何”携手取得银牌级成绩。
19日,OpenAI宣布其新型AI系统在4.5小时内正确解答6道国际奥数竞赛题中的5道;两天后,深度思维的“双子座深度思考”系统交出了同样的成绩。IMO主席(xí)格(gé)雷(léi)戈(gē)尔(ěr)·多(duō)利(lì)纳(nà)尔(ěr)证(zhèng)实(shí),成(chéng)绩(jī)经(jīng)由(yóu)竞(jìng)赛(sài)官(guān)方(fāng)阅(yuè)卷(juǎn)人(rén)严(yán)格(gé)评(píng)定(dìng)。
与(yǔ)“阿(ā)尔(ěr)法(fǎ)证(zhèng)明(míng)”和(hé)“阿(ā)尔(ěr)法(fǎ)几(jǐ)何(hé)”系(xì)统(tǒng)都(dōu)专为IMO打造,且使用名为“精益”的计算机编程语言编写问题和答案不同,今年两大团队的模型均采用自然语言处理技术。
“双子座深度思考”开发人员解释称,强化学习是机器学习的一个分支,旨在让智能体在环境中通过试错来学习如何实现特定目标。这种方法是谷歌此前在“阿尔法零”等AI游戏上取得成功的关键。
OpenAI则仅透露运用了强化学习与“实验性方法”,技术细节仍笼罩在迷雾中。
菲尔兹奖得主、美国加州大学洛杉矶分校数学家陶哲轩评价道,这一进展令人振奋,但需要可复现的研究数据支撑。IMO金牌得主约瑟夫·梅耶指出,自然语言证明虽具可读性优势,但冗长论证可能带来验证困难。
(原标题为《AI模型取得国际奥数竞赛金牌级成绩》)
微信公众号搜索“ 新能源 ”加关注,最新环卫前沿洞察、企业动态、产品公告全面了解。推荐关注!