谷歌人工智能做高中数学 40题只对14题

【文观察者网/赵挪亚】
在围棋这个人类一直以来占据着优势的项目里，谷歌旗下deepmind开发的人工智能（ai）alphago已经先后击败了柯洁和李世石两位顶尖棋手。但说来难以置信，deepmind开发的ai能打败人类世界棋王，却无法通过英国高中的数学考试。
《分析神经模型的数学推理能力》
4月2日，谷歌旗下的deepmind团队公布了一份名为《分析神经模型的数学推理能力》的研究报告（analysing mathematical reasoning abilities of neural models）。在这项研究中，团队让ai接受一项包含了算术、几何、概率和测量的数学测试，考题有 40 题，难度大约是英国高中数学的程度。
deepmind给出的40道英国高中数学题
不过，在这40道高中难度的数学题中，拥有强大通用算法和远超人类计算能力的人工智能，却只答对了14题，正确率只有35%，是实打实的不及格。
值得一提的是，在ai参加测试以前，团队已经为其做好了充足训练。据deepmind介绍，他们为ai建立了一个包含200万道题目的题库，涵盖了算术、代数、概率、微积分等各种题型。
同时，团队也派出了循环神经网络 (rnn) 和transformer两大当下性能最先进的模型参与测试。
为什么人工智能无法答对高中数学题呢？
原来，最主要的原因是ai“看不懂”题目。deepmind旗下的ai虽然已经拥有了极强的机器翻译能力，但依然抵不住数学问题的复杂性和语言多样性的压力。
对ai而言，数学符号和题目本身就很难理解
对人类而言，要解决数学问题，要应用到的不只有计算能力，还有各种各样的认知技能。比如理解题干，需要将文字或图标转换为算术运算符。
而对于依赖大量数据分析来寻求解决问题规律的ai而言，数学语言的复杂性是一座难以逾越的高山。
其次，ai“举一反三”的能力，也无法与人类一较高下。它只能处理一些内部存储的问题，无法超越已有的环境去理解新的东西。
而人类在解决数学问题时，会进行推理，从已知的公理中找到最佳策略，而在具体的运算过程中，必须利用工作记忆来完成运算。
据deepmind研究人员总结，现阶段ai在推论的能力上，还不及人类。在解答问题时，人脑动用了多种认知能力，包括将符号分类、演算、运用工作记忆来储存中间值、还要运用学到的规则或定理等。
相反，ai则擅长模式比对、机器翻译和强化式学习，但弹性远不及人脑。它们不太能将事物推论到已有经验的环境外，更无法处理刻意乱输入的资讯。
不过，虽然目前ai还无法当数学老师，但他们已经称霸了相当多的领域。除了围棋以外，deepmind旗下的ai又在游戏《星际争霸2》（starcraft ii）的测试赛中，5-0横扫世界顶尖职业选手。
本文系观察者网独家稿件，未经授权，不得转载。

谷歌人工智能做高中数学 40题只对14题

推荐信息