满分试卷只得35分DeepMind高考数学竟不及格
相信大家对AlphaGo多少有一些了解,它曾战胜世界排名第一的围棋选手柯洁,并让后者崩溃痛哭。
日前,Alphabet旗下的DeepMind团队让AI系统当了一回“高中生”,并进行了一场同等程度的数学考试。
最终成绩显示,这个智能水平处于世界领先地位、曾经数度打败围棋顶尖选手的AI系统只答对了40道题中的14题。按照100分制,该AI系统只考了35分,远远不及格。
据了解,这40道题目中覆盖了算术、几何、概率、测量和微积分,难度大约是英国高中数学的程度。
结果 DeepMind 虽然在一些题目上表现不错,但是碰上文字、加减乘除符号、函数等组成的问题时,却因看不懂题目而无法作答。
其中有一道题目是 "1+1+1+1+1+1+1",连小学生都知道答案是 7,但 DeepMind 却答成了6。
研究人员解释,DeepMind 神经模型最长可以计算出现次数(n) 6 次以下的数值,但如果 n = 7,它就算不出来。当 AI 碰到同一数字出现多次,它会认为输入值是出错的。奇怪的是,碰上更长的加法题目,DeepMind 却算得出来。研究人员承认还找不出很好的解释,但很可能是因为 AI 神经网络不断观察每道问题,从而做出正确的解答。
此外,当研究人员要求 DeepMind 在一长串数字中找出 " 位值 "(place value),它就能答得很好,因为它可以按数字大小排出顺序,也能将小数四舍五入。
下面是研究使用的40个高中数学题: