彰明德行   教育立人

4008884251

扫一扫咨询

AI大翻车,数学大神陶哲轩的预言成真了

专业解析 院校排名 录取捷报 干货分享

在不少人心中数学能力快要取代人类的AI,最近却大翻车了!
起因是大型语言模型(LLM)频繁在各种数学测试中刷分,正确率动辄90%以上。60位顶尖数学家看不下去,出了一套叫作FrontierMath的全新数学推理测试,都是AI从没刷过的题库。
结果AI的正确率不到2%。


 

 

AI解不出来的题目接近100%。

于是,数学界最高荣誉奖菲尔茨奖得主、加州洛杉矶分校教授陶哲轩说:

 

「靠这些题目,人类还能赢AI几年」。

 

作为一直走在研究前沿的数学家,他和卡内基梅隆大学的数学教授罗博深一样,一直在AI浪潮下相当冷静。

 

一个势必要到来的AI时代到底是什么?

 

这让我想起上半年两位数学大神在牛津大学的一次精彩对谈,预言了AI的本质,以及一个与孩子们息息相关的「大数学时代」和「实验数学」的到来。

 

 

 

01

「飞机」的诞生

 

作为深谙AI背后数学核心基础的科学家,陶哲轩把人工智能的出现比作飞机的诞生。

 

一开始,我们有了汽车、火车和轮船,接下来,有人发明了喷气发动机,只是功能非常少,只能是玩具。

 

随后很多年迭代中,发动机越来越大,性能也越来越强,速度也越来越快。这个时候,我们能把这个强大的喷气发动机绑在汽车和船上,让它们跑得更吗?

 

显然这不是安全的选择。

 

「你必须彻底改变交通运输的想法,必须设计出新的运输方式,新的安全协议和仪表设备,飞机就此诞生了。」

 

人工智能也是一样,它不是这两年凭空出现的,它也是从最基础的软件一步步进化而来,区别就在于,以前的人工智能模型都是「汽车」,而如今的版本是「飞机」。

 

 

人工智能的历史可以追溯到1943年,公认的第一个人工智能是一种人工神经元模型。

 

1.0的汽车版本,到2.0的飞机版本,有什么不一样呢?

 

陶哲轩说,「汽车」版本的计算机软件,它们都很「无聊」,被程序和代码设定好了每一步的走向,一切都是可预测的。

 

而如今「飞机」版本人工智能模型,第一次拥有了创造力,——

 

你不需要严格按照既定代码输入,只需用我们日常聊天的自然语言,哪怕说得再不标准,它也能读懂你的意思,给你想要的东西。

 

不过,令人意外的是,陶哲轩说,「人工智能并不是最先进的数学工具,它只是一个猜谜机器」。

 

为什么叫做猜谜机器呢?和人工智能解决问题的方式有关系。

 

在数学领域,1%的AI的确非常强大,比如谷歌的AI已经达到IMO奥林匹克数学竞赛人类银牌级别的水平,但99%的情况中,依然有很多AI在小学生的数学题上出错。

 

同样的一个问题、一个做图需求,你查询两次,就会得到两个不同的答案,还不能保证都是正确的。

 

它没有一个内部计算器去解决数学问题,而是像一个只记住了部分知识的学生做题,为了尽快做出来,而凭着过去的经验和记忆来一次次猜测,去接近你想要的正确答案。

 

陶哲轩还发现更加好玩的是,AI还特别嘴硬。

 

AI算错了题后,你说「正确答案应该是120」,它的回答却是:「你给的是个错别字,正确答案是120」。

 

「如果你要用AI帮助数学学习,最好不要相信它,而是准备其他的计算机软件,来验证它的正确性」。

 

在陶哲轩看来,正是AI的这些「缺陷」,决定了它们作为专家的可信度和安全性都不高。

 

这也就意味着,像财务、医疗、公共安全,以及需要精密计算的领域,精确意味着一切,完全容不得一次次猜测,AI并不能代替人类做出决定,太过依赖反而可能造成严重伤害。

 

02

AI也像水龙头

 

从另一个角度来说,在另外一些负面风险很小的领域,AI的好处要比人类想象得多。

 

对于特别适合将AI利用起来的领域,陶哲轩又用了一个巧妙的比喻:AI就像一个特殊的水龙头」。

 

它的特殊之处在于,出来的水虽然不是质量好的直饮水,但它一瞬间能输出的水量要比传统水龙头多100倍、1000倍,如果你有一个过滤装置,就可以获得比以前多得多的饮用水。

 

「这就是人工智能时代的科学和数学」。

 

 

陶哲轩在IMO2024决赛颁奖礼上也发表了演讲

 

而一旦把AI看作水龙头,就可以解决科学研究中存在已久的大瓶颈——样本人选不够多的问题。

 

AI&生物

 

在医药行业,你想治疗某种疾病,而要想合成对症的药物,必须从自然界或者人工合成中获得初始状态的原料,然后才能进行后续的合成,以及第一阶段、第二阶段的实验。只有最大的制药公司才有能力等待。

 

当有了AI,这些浪费或许都可以避免。

 

它可以为蛋白质建模,可以快速运行大量的数据,你就可以对各种药物的功能进行建模,你就可以无需等待太长,以前需要测试100个药物,如今只测试10个就行了。

 

 

AI在健康产业中的应用

 

AI&化学

 

还有AI在化学领域的应用,比如你想找到一个新的超导体。

 

但是传统的合成过程同样非常昂贵,也很危险。而AI可以把部分合成过程用建模的形式预测出来,缩小可选范围,将之前需要人工合成的设计实现自动化,就可以又快又好又安全。

 

 

 

AI&气候学

 

陶哲轩做了个总结:人工智能时代对于世界上各行各业的根本改变之一,在于我们必须为各种事物建立模型——

 

比如要想预测未来20年的地球气候,传统方法是将地球划分成非常小的网格,运用已知的数据和物理地理定律计算,超级计算机可能要花费几个月时间算出来,而AI就可以对现有的模型进行训练,输入数据预测最佳的拟合方案。

 

还有像飓风这种罕见极端天气的走向、登陆点,AI模型的预测功能也特别好用。

 

目前已经有科学家在给气候建模了,而且成功地达到了超级仿真的精确度。甚至普通的天气预报,AI的预测速度都能达到过去10000倍的速度。

 

 

今年来自Nature的文章,分享了AI在气候预测上的应用

 

但正如AI本身的不足一样,它在建模上的运用依然存在一些瓶颈,像是收集大量数据,并将其在AI之前格式化,都是科学工作人员们正在攻克的难题。

 

也正是这些「进行中」的科学、数学突破,让陶哲轩格外感慨地说:

 

「我对人工智能如何改变世界感到非常兴奋,革命已经来了」。

 

 

AI的确在世界各行各业引发革命

 

03

「大数学时代」即将来临

在这场演讲中,陶哲轩还与我们也采访过的罗博深教授,来自了一次有意思的炉边谈话中。

 

两位数学家金句频出,让很多人一下子对AI祛了魅:

 

「人们通常认为,能像人类一样用自然语言聊天,就是智慧的巅峰了。人工智能虽然已经可以做到了,但它实际上并不那么智能。

 

AI工具的作用就是预测下一个要说的词。

 

就像我们用手机打字,打完一个词语,键盘上方会自动出现一些可以衔接的惯用语言。这个功能并没有多么智慧,甚至会产生语言垃圾,说一大串正确而无用的废话。

 

相反,人类觉得困难的事情,它却觉得容易,比如它可以自动为很多看起来复杂的数学证明填充小步骤」。

 

 

谷歌的AlphaGeometry在解IMO的几何题

 

不过,对于人工智能在数学领域的未来,两位数学家的态度还是相当有信心的,就像看待一个正在成长中,一不小心就会犯错的聪明小学生一样。

 

陶哲轩说,「人工智能将和数学产生巨大的协同作用,未来将会出现一个大数学时代」。

 

就像他在今年2月份接受美国著名科学杂志Quanta Magazine时说的:

 

数学学科已经成熟了很多,并正在专注于互联和应用,与现实世界的联系更加紧密。像计算机科学、生命科学、社会科学等等,随着大数据的兴起,几乎任何人类学科都可以在一定程度上被数学化。

 

同时,有了AI以后,数学研究正在变得更加全球化。

 

比如过去数学家之间进行合作,共同证明一个定理,只能在小范围内协作,因为每个人都必须验证其他人的数学步骤是正确的。

 

数学家之间很难真正「信任」。而这个致命缺陷,真正抑制了数学领域的真正大规模合作,也把很多业余数学爱好者隔在了门外。

 

而有了AI以后,全球的数学家、爱好者即便不认识、不信任,也可以将自己的东西上传到某个Github存储库或其他的社区进行交流,而独立的AI辅助验证技术可以对其进行100%的验证。