杨元庆对话李彦宏:百度大脑智商堪比4岁孩子

29.05.2015  20:00

新浪科技讯 5月28日消息,联想Tech World大会今日在北京举行,百度CEO李彦宏在现场演示了百度人工智能技术在语音识别、翻译以及图片识别的进展。他表示人工智能和大数据能通过2D的照片还原出3D的图像或者3D的场景,例如合成每一张照片的拍摄角度、拍摄时间,就能还原被毁的古建筑原貌。

李彦宏还表示,最近几年百度在人工智能方面的投入非常大,现在“百度大脑”的智能水平已经达到了3、4岁孩子的智力水平,未来大数据的积累越来越多,人工智能技术不断的推进,“百度大脑”会逐渐成长,越来越接近一个普通人或者成年人的智力水平。

李彦宏对话杨元庆原文:

杨元庆:让我们请出百度CEO李彦宏。欢迎来到联想科技创新大会。这几年百度在人工智能上面下了很大的功夫,不但要建超级计算机,要建“中国大脑”,而且还在硅谷建立了实验室,全世界广泛招募人才。请问Robin你们为什么看好这个领域呢?

李彦宏:人工智能对于百度来说是特别重要的,因为我们每天都会用到很多和自然语言理解、语音识别、图像识别、图像分析这些技术有关的功能,这些技术的基础就是机器学习、人工智能和大数据。最近几年百度在人工智能方面的投入非常大。同时,由于联想、英特尔,微软的创新,使得计算的成本越来越低,能力也越来越强。原来那些人工智能想做而不敢做的事情,现在都可以做了。所以今天我想和你一起看一些演示,看看百度人工智能技术到底能做到哪些过去不能做到的事情。

杨元庆:太好了,我们的粉丝期待着呢。

李彦宏:假如咱们俩到了一个陌生的国度,这个国家说的是我们听不懂的语言,但是我们又想去尝一尝地道的当地菜。比如我们到了韩国,咱们俩都不会说韩语。今天我们现场有一个讲韩语的服务员,她拿来一个菜单,大家会看到菜单上面只有韩语,现在,元庆你可以用手机拍一下菜单,我们就能知道它是什么菜。

【杨元庆用手机对照菜单上文字拍照,手机屏幕显示出相应菜色的中文翻译】

百度翻译App可以把菜单上的韩文直接翻译成中文,也就是说,它可以直接把我们不懂的当地语言翻译成我们懂的语言。

杨元庆:Robin,我知道除了这些以外你们还有很多的创新技术,你想给观众介绍,舞台就留给你了。

李彦宏:目前,大家可以随意下载和使用百度翻译App,可以自己去做尝试,而且它不仅支持韩语,也可以支持大约18种语言,例如希腊语、日语、葡萄牙语等。其实我们的工程师并不懂得各种各样的语言,之所以能够做出不同语种之间的自动翻译,是因为我们运用了机器学习、大数据、人工智能等技术。网络上有各种各样的语言,比如同一家餐馆的网站上既有英文介绍,也有中文或韩语的介绍,我们的机器根据这些内容进行学习,就可以逐步地领会到不同语种之间语言的意思、以及如何转化,这就是机器语言所做出的翻译。

此外,计算机的人工智能不仅可以听得懂,也可以看得明白。例如,前几位的演示中所使用的相机、全息摄像之类的设备和技术,它们记录下来的信息怎么才能让机器可以理解,这也是人工智能需要解决的一个重要的问题。

下面我给大家演示一个类似于人类看图说话的过程。

我们看一个图。

【李彦宏在手机上打开Image QA,与之对话】

他在做什么?”“打网球。

他穿的衣服是什么颜色的?”“蓝色。

他手里拿着什么?”“网球拍。

所以正如大家看到,通过我们的技术,电脑可以看得懂一个图片,而不仅仅是记录下来图片。

我们再试一张图片。

这是在哪里?”“这是在路边的街道。

这是什么?”“ 这是禁止停车标志。”

标志是什么颜色的?”“ 红色。”

大家可以看到,我们的计算技术已经可以模仿人的能力,它真的能够看得明白我们看到的场景、我看到的图片。刚才元庆提到“中国大脑”,实际上是我们提议的一个集国家之力去做的人工智能项目。实际上,百度已经在做“百度大脑”项目,它相当于“中国大脑”的一个迷你版。现在“百度大脑”的智能水平已经达到了3、4岁孩子的智力水平。我刚才给大家演示的看图说话,就是通过“百度大脑”来智能的读取信息内容,并且你在提问题的时候,它可以正确的理解。未来,随着我们创新的继续,随着大数据的积累越来越多,随着人工智能技术不断的推进,我们的“百度大脑”会逐渐成长,越来越接近一个普通人或者成年人的智力水平。

当然,我第一个演示实际上是语音识别和翻译,第二个演示是图片识别。大家也注意到,这张图片实际上是2D的,而刚才几位都演示了一些3D的东西,比如绕着元庆拍一圈,就知道这个人立体的样子,不同的位置、相同的尺寸都可以展示。在过去这些技术是没有的,但是我相信未来会越来越普及。比如一个多月之前,尼泊尔不幸发生了地震,在地震中很多加德满都的古迹遗址都被毁掉了。所以,我们也想利用像全息3D那样的技术恢复加德满古迹的原貌。大家知道,很多人去过尼泊尔旅游,也拍了很多照片。但是这些照片是2D的,如何通过2D的照片还原出3D的图像或者3D的场景,也是我们的人工智能和大数据试图解决的问题。

下面我请大家看一段视频,来解释我们是怎么解决问题的。

我大致给大家解释一下这个工作的原理。虽然很多人拍了很多平面的照片,但是他们拍摄的角度都是不一样的,这就好像是有无数的人绕着这些个古建筑拍了无数的照片。百度要做的事情就是,根据照片来判断这个人的拍摄角度,比如他为古建筑拍摄时所站的位置。单靠一张照片我们判断不出来它的角度、判断不出来拍摄它的时间,但是当无数的照片都串在一起的时候,我们用人工智能的技术就可以搞清楚每一张照片的拍摄角度、拍摄时间,然后再把他们合成起来,这样就还原了被毁的古建筑的原本的样子,这就是3D的人工智能技术。

其实人工智能技术还能做很多事情,而且很多研究才刚刚开始。人工智能这个概念已经有五、六十年的历史,但是前五十年基本都是学术性的探讨,并不实用。刚才我也和元庆讲,最近几年,随着计算能力的增加以及计算成本的降低,原来我们不敢想、不能做的事情,现在能想了、能做了。对此我也有非常深刻的体会,创新不是某一家公司的事情,而是很多公司、很多优秀人才相互激发、相互鼓励、相互促进、甚至相互竞争的过程,这样才会导致创新不断发生。联想也好、英特尔也好、微软也好,都有很多的创新,百度的这些创新则是站在他们的肩膀上又往前迈了一步。未来我也很希望联想、微软、英特尔以及很多其他公司,能跟百度一起相互激发、相互竞争、相互鼓励,把技术不断往前推进,让技术真正地改变世界、改变我们每一个人的生活。谢谢大家!

杨元庆:谢谢Robin,你在建“中国大脑”,建超级计算机的时候别忘了联想可以帮忙。

李彦宏:一定的,(我们)一定要买联想的服务器。

杨元庆:这是技术改变生活的最好的注解,让我们用热烈的掌声再次感谢Robin的精彩演讲。