以下为演讲实录:
吴恩达:谢谢,大家好,人工智能已经在世界有很大的影响力,百度是引领人工智能发展的公司之一,今天我想跟大家分享一些我们正在做的先进技术,我也希望未来我们能把这些技术开放给我们的合作伙伴。
从李彦宏讲的一席话里我们看到语音识别重要性,百度和北京团队一起正在研究新一代的语音识别技术,让我为大家演示一下。这是一段用户手机的录音,请大家仔细听听,你能听出他在讲什么吗。来。现在请大家闭上眼睛再听一次他到底在讲什么。有时候由于噪音、口音等等,很难听清楚电话那边的人在说什么,我们把这段语音放给我们的语音识别系统得到这个结果,是说中国好声音几点开始,请大家再听一次。
让我们看一下第二个例子,我们听一听。再听一次。这就是语音识别的结果,大床房多少钱,再听最后一次,听到了吗?这个技术还没有上线,目前在很多情况下人的语音识别能力还是比机器识别更准确,但是我们发现如果只有一段很短的语音,尤其是在比较吵的环境下机器识别可以超过人的识别,一年前我没有想到这么快机器就可以做到这点。
我相信语音有很大的潜力改变人与设备的交互方式,现在语音识别可能已达到95%的准确度,但要看你的口音等等来定,很多人没意识到95%的准确度到99%的准确度带来的不是量变是质变,是从你偶尔使用语音变到常常使用做到更自然,做到99%准确,将彻底改变人与设备交互,这个技术的进展让我对人与设备全新交互充满信心。
在百度人工智能技术的进展主要靠深度学习,深度学习的意思是建设巨大的神经网络,语音识别也是用深度学习做的。
我们再看另外一个例子,王劲刚才讲了也是用深度学习做的,我们把图片交给神经网络他就会告诉人面前是什么。
在这一年中我们在深度学习基础架构上有很大的进步,这对人工智能的研究有很大的影响,我们的技术架构分为三个部分,第一就是用于训练的超级计算机,第二就是用于在线服务的云加速器,把训练后的加速器放到云端在线服务。第三就是手机上的深度学习引擎,让我详细解释一下这三个部分。
如今已是海量数据的时代,百度有着大量的数据可以使神经网络训 练的更大效果更好。我们开发了HPC来做深度学习试验,这里百度使用很多的GPU做HPC,在使用HPC做深度学习训练上,百度处于世界领先地位。这里做 HPC的一个难点是提升GPU的使用效率,2014年GPU的使用效率是20%左右,我们目前GPU使用效率可以提升到85%,让我们能够更快的训练巨大 的神经网络。
使用HPC训练巨大的神经网络之后,下一步是使用它提供在线服务,例如当用户讲话时,系统会实时返回结果。普通的CPU服务器有时候很难做到运行巨大的神经网络, 我很高兴像大家宣布百度已经开发了两个加速技术,第一我们开发了FPGA加速器,在很多重要的应用下他可以把速度提升五倍左右。第二我们也开发了GPU加 速器,这里GPU不仅用于训练,我们也打算将其用于在线服务。百度的这种技术也是在世界上领先之一,这样做的难点是如果有十个用户在使用一个服务器,我们 需要找到一个聪明的方法让一个CPU有效的为十个用户提供服务,使用这个技术,我们可以在在线服务上明显的提升神经网络规模。
对于一些应用,把数据传到云端太慢,影响用户体验,所以我们需要在手机上运行深度学习引擎。用HPC训练了巨大的神经网络后,把这个神经网络运行在这么小的手机上很难的,所以我们开发了手机深度学习引擎。
我们来看一个例子,我们想识别人脸,并理解表情,我们开发了一个深度学习系统,可以识别人脸上的72个关键点,对比其他系统我们识别了比较多的关键点,让我们有更多细节来理解表情。
在手机上运行神经网络,难点是模型规模、速度和错误率,这张图是一个神经网络在PC上运行的结果,这个神经网络对于手机来说太大了,用我们的手机深度学习引擎我们使用了一个聪明的办法,将神经网络的模型减少,还大量提升运行速度。
使用手机深度学习引擎,我们做了一个新的APP叫做(脸优),我们刚刚在IOS发布这个APP,用手机拍一张你的照片,用神经网络识 别出你的面部,然后和另外一张图片放在一起效果就是这样。让我们为大家演示一下,这就是我的手机,我刚刚今天早上跟我其他的演讲人拍的他们的照片。这就是 我的脸变成了就是王劲,也可以变成李彦宏,很好看,这就是Travis 再试一试,很帅。做女性的也可以,其实这就是我妻子的图片,还有这就是我们的CFO,好,就这样,谢谢。如果你有iphone,我希望大家下载玩一下。
脸优是一个娱乐的APP,是需要非常快的响应速度,那么手机深度学习引擎还有什么其他用处呢?假如你和你的孩子一起去超市买东西,你们看见了这盒牛奶,我 拿了一盒牛奶,如果你的孩子对这盒牛奶好奇你会怎么办?我们与伊利合作做了一个直达号轻应用,它可以识别出牛奶盒,并让你看到一个3D效果的地图,也可以 从不同的角度来看它,从上面可以看,可以啊,远一点,台上灯光很亮,看见了,那你可以从不同的角度看这个地图,如果小朋友点击这个地图也可以看到另外一端 牛奶的信息。这个轻应用两三个月后会上线,这个可以利用产品的包装上的图案提供增强现实体验,不需要特别的图片或二维码,增强现实技术可以让你更多的了解 我们的世界,我们目前还是和很少的商家合作,希望未来有更多的商家可以使用这个技术,帮助用户了解产品并探索世界。
百度已经有很多人工智能的产品,我们的深度学习基础架构可以让人工智能越来越好,派发出更多更新产品。最后人工智能的未来是什么?在我结束演讲前,我想向大家讲讲人工智能的前景。
很长时间以来我们一直在讲百度大脑越来越聪明,这很重要,他能让我们对用户提供越来越好的服务,但这还不够,人工智能的 下一步不止是百度大脑更聪明,也能够使用户也更聪明,像李彦宏提到的度秘,技术可以成为你的合作伙伴,让你变得更有效,虽然是你本人决定去哪里旅行,决定 吃什么,决定买什么衣服,但是技术可以成为你的智能伴侣,帮你更好的了解信息,做出选择,做出定,这里技术需要了解你的想法,也需要与你交互,语音识别是一个重要的方法,也是技术与人交互的例子,李彦宏讲的秘书化也是这个意思,因此我对人工智能成为人类合作伙伴的未来充满信心,我也希望与大家共同走向智能伴侣时代。谢谢!