不久前百度宣布在人工智能基准测试中取得了世界最好成绩,超越了微软和谷歌的超级计算机。半个月后,事情峰回路转,相关组织宣称百度在测试中存在违规行为,百度也为自己“误导公众”而道歉。
早在5月中旬,百度向外界表示,其超级计算机Minwa在一项挑战中取得了世界最好成绩。他们在测试ImageNet分类数据集的错误率仅4.58%,相比之下,在同一时间段,微软的人工智能系统的错误率为4.94%,谷歌为4.8%。百度如今已将这一错误率进一步降至4.58%,《麻省理工科技评论》等权威科技媒体对此事予以报道。
半个月后的6月2日,ImageNet的计算机科学家发表声明指出,百度在测试中存在违规行为——按照规定,ImageNet只允许参与者每周向测试服务器提交两次测试结果,可是在3月份的5天时间内,百度却提交了40次结果。ImageNet表示,百度还使用了30个不同的账号,在过去6个月中提交了约200次测试结果。
换句话说,百度通过增加测试次数,来提高自己的成绩。
ImageNet分类数据集测试是一项备受关注的人工智能基准测试,百度和谷歌等公司在测试中依靠的都是一种名为“深度学习”的算法,通俗来说就是机器能够模拟人脑,具备分析学习的能力,这种算法这两年才从学术界引入到硅谷,谷歌率先将其引入日常搜索领域。
在测试中,一般需要对包含100万张图片的ImageNet数据库进行扫描,然后机器学习如何将这些图片分成大约1000个不同的预定义类别,这就意味着,机器要自动学习法式面包和烘肉卷之间的差别。
而密集测试可以直接提高成绩。通过提高测试次数,百度工程师可以通过调整他们的软件熟悉这些图片的信息,从而获得优势。
百度的作弊行为凸显了在人工智能领域的激烈竞争。
最前沿的科技公司都唯恐在这一领域落后。包括谷歌、微软、百度以及Facebook都在这一领域做出了巨大的投入。百度为了在这一领域的竞争中取得优势,将原本服务于谷歌的吴恩达邀请至百度工作,并为其在硅谷建立人工智能实验室。吴恩达是人工智能领域是公认的领军人物之一,2011年吴恩达曾经创建并领导了谷歌的深度学习团队,他们所从事的项目是,用1.6万台电脑组成“神经网络”,通过处理数千张猫的照片,“神经网络”最终学会了识别一只猫,这就是传说中的“谷歌大脑”, 吴恩达也因此被外界誉为“谷歌大脑之父”。
至少在人工智能领域的学术声誉上以及在科技公司中的商誉上,百度会因为此次作弊事件受害。
ImageNet已经要求百度在今后一年停止递交ImageNet测试结果。百度拒绝回答相关问题,但在ImageNet网站发表声明称,百度科学家吴韧已经为他所谓的“失误”道歉。他写道,“我们已经在研究中添加了注释……我们将继续提供相关更新。”
评论