[核心提示] 图灵认为人类的智慧可能存在于量子力学中;现在的我们认为可能存在于大数据精巧的构造中;或者,智慧就存在于三元组中。
「如何证明在你的研究领域做到最前沿,只要在你研究领域最好的前 5 个学术会议发布的学术论文比例达到 5%,我就承认你成功了。」
信念的神奇之处在于往往会产生出乎意料的结果。从 2002 年发布第一篇论文开始,第二年发布三篇、后来六篇、九篇……直到学术会议 15% 的论文,都来自知春路 49 号——微软亚洲研究院曾入驻的希格玛大楼。
回忆十几年在微软的工作,微软亚洲研究院常务副院长马维英并没提及当年这个目标设下的太多困境。但从他曾经写下的文字可以了解刚回国的他如何「水土不服」一病几个月、带着和 12 个小组领域不合的「散兵游勇」们寻找方向、还戏称自己是研究院的「Other 组」(其他组)。
理想化的团队氛围也好、坚持信念的执着也罢,Bing.com 从无到有,「话痨」小冰也渐渐显露出与最初完全不同的面貌。至于人们通过机器寻找的「智慧」,马维英也在勾画自己的答案。
理想国和散兵游勇的运气
2001 年从硅谷惠普实验室回到中国,马维英正式加入微软亚洲研究院。北京的气候、工作的转变需要时间适应,最可怕的,还是没有研究方向。
「那时候基本大组已经成型,包含语音组、自然语言、多媒体计算等几大领域。我来了之后负责余下的包括人工智能、数据库、网页分析、信息检索等不同领域的研究员。一年半的时间我们是在找方向,因为其他人都很清楚要做什么,但是我们有很多不同的方向。那段时期压力非常大。」
入职第二年,微软决定做搜索引擎。当时的微软亚洲研究院并没有真正的搜索团队,马维英想了想,就带着自己的「Other 组」转向这一方向。
网页搜索跟传统信息检索的不同在于「它既是一个系统的问题,又是用户的问题」。图书馆用卡片就能找到书籍位置,可是面对搜索框永远无法控制用户的行为。互联网搜索需要解决的问题常常横跨多个领域,信息检索、数据库、数据挖掘、人工智能、图像分析、网页分析……「Other 组」成员不同的领域专长终于派上用场。每个人都分享自己看到的热点、难题和趋势,彼此之间提出问题和建议,激发的成果也开始坠地。
和微软给人「刻板」的大公司印象不同,微软亚洲研究院有着近乎理想化的宽松学院氛围。不设工作时间打卡满 8 小时即可,凌晨 3 点或是下午来工作都没有关系;茶水间永远有食物饮料,办公室可以摆放钢琴,或者暑假期间孩子也可以来这里读书、写作业、玩足球机。
「做研究的人很容易害怕失败,人一旦怕失败,在创新上就会束手束脚。」与物质层面的宽松对应的是精神层面的自由,包含近乎理想化的气息。对马维英来说研究院的 14 年经历有不同阶段,最重要的是对每个人产生正面积极的影响。「不再专注于自己的得与失所培养出来的勇气和信心,就可以帮助他们成就更大的事情。」
编程之美采用关卡通关的方式进行比赛选拔
采访马维英的当天,他正在参加「编程之美」挑战赛开幕式,与学生们分享微软在人工智能领域的最新成果。「编程之美」是微软的一个有趣项目,自 2012 年起开始面向在校学生举办的系列编程挑战赛,通过网页游戏的方式,寻找优秀参赛者、鼓励他们开发潜能、通过创新方法应对现实问题并给予优胜者实习机会。这一届编程之美以人工智能为主题,鼓励学生设身处地考虑人工智能的应用场景。通过分享搜索等人工智能重要领域的进展,马维英希望帮助同学们开拓思路和眼界,为接下来长达 3 个月的挑战赛做好准备。
下一代搜索,没准就是小冰
Magi 是最近出现的一个不太一样的搜索引擎,当你问「总统山上的四个人是谁?」它会给出四个人的名字。当你进一步问及他们是什么党派,则会得到一个包含他们姓名和党派清晰列表。
Magi 称自己为「自然语言搜索引擎」,这是不是代表了搜索引擎的未来趋势?
面对这个问题,马维英给出的答案似乎有些出乎意料。「小冰给我们一个很大的启发,原来看到搜索框你只是输几个关键字,并不期待那个框能对话。但是小冰更像一个对话的界面,更接近人与人之间的交流……小冰对搜索来讲是一个全新的窗口。」
「国民女友」或者「机灵鬼」,小冰一直被冠以「陪伴」属性,当作「寂寞」时的陪聊玩偶——类「人」的属性背后,驱动力仍是机器算法。她和搜索之间又有什么关系呢?
在对话过程中,通过学习了解「个人」的意图使小冰带来与众不同的「养成感」。可以进行十几次对话理解用户的真实意图,远超搜索引擎的单次记忆。小冰可以扮演「角色」,担任孤单老人的沟通桥梁,通过不断的对话了解一个人的人生经历,并将这些故事不断讲给正在失去记忆的老人听。在与京东的合作中,小冰可以将购物行为融合到对话中,用聊天的方式了解产品怎么样,该不该买。
除语言之外,小冰还在学习自如运用和处理图像,「小冰识狗」可以认出图片中狗的种类,答错后还能通过与人的对话学习,或者在对话中用图片表情回答用户的问题。
「人工智能要找出口,需要人能够接受的人机界面。」
小冰是一个界面。她代表着全新的搜索入口。
「在小冰跟互联网上千万人不断互动的过程中,我们也不断的学习,不断改善我们的精度,不断改善人工智能的模型。这里面就会形成一个新的摩尔定律,就是说小冰的人工智能每一年能够增加几个百分点,虽然这个百分点不见得多,但是如果你每一年都要增加的话,这个就了不起了,因为它就是一个正循环。正循环的话就一定是指数的增长。」
而我们孜孜以求的智慧,可能就存在于三元组中;但不能否认的是人工智能和机器智能之间,还有遥远的距离
那么担任界面的小冰,不是人工智能么?
早在 2002 年拉里佩奇就曾说过「我们正在尝试的就是人工智能——最终搜索引擎会很聪明」,认定谷歌是一家人工智能公司。
每一次搜索都是一次人机对话、一次对机器的提问。搜索引擎通过数据积累变得更加聪明,成为一种代表性的机器智慧。而这种智慧全部开始于 0 和 1。二进制机器语言的简单逻辑通过 0 和 1 制造出复杂的计算机世界,「人工智能的基本数学模型我想也一定很简单,只是我们今天还没有发现,但是一定很美。」
寻找智慧的图灵最后将目光放在量子力学,希望从基础物理学中找到答案弥补机器的不足之处。50 年后的今天,人们仍未找到智慧的本质。
马维英也在寻找人工智能的答案,「我相信可能也和三元组有关。今天的搜索引擎只靠对偶这样的二元关系,文章包含字、字被文章包含,一个正排表、一个倒排表,搜索引擎就是在这两张表里算出很多的特征。但是我们现在越来越多开始到三元组——主词、谓词、宾词的结构,通过类似这样的元素寻找实体的关系。把全世界所有的事物用三元组来代表,包含数据库的知识、实体和实体的关系、主谓宾词还有问题、答案。」
用三元表达将世界穷举,就能做语言上的理解、推理与问答,智慧也可能存在于此。「这个宇宙的奥秘一定是很美,原理很简单,但是千变万化从此开始。」
可当下对于人工智能的恐惧呢……难道这样的乐观,就能忽略机器和人之间尚不清晰、或敌或友的关系么?
马维英笑了,「为什么有时候我会用两个概念一个叫人工智能,一个叫机器智能?」机器智能并不等同于人工智能,喷射机飞的比鸟快原理不一定要模拟鸟怎么飞行,机器有机器的特长,机器不一定要完全模拟人大脑怎么运作怎么思考。因为机器很能计算,很能记东西,只要给它,它就能记下来。它能够记住所有的东西,所以它可以用最简单的搜索,就能够做很多人做不到的事情,做的比人更好。而机器的这个优势可以帮助人的工作和生活,弥补不足。
人的创造力、想象力,机器要抵达这些能力还有很远。「所以,我觉得应该这样来看,机器智能能够怎么样为我们所用,能够在工作、生活上帮助我们……能够处理重复性的工作,这算人工智能,还是机器智能?」
预言人工智能会有很多对人类社会的威胁,马维英却认为机器智能和任何一个技术出现时没什么不同,带来机遇和挑战是一定的。「机遇是我们今天能够重新定义生产力,但挑战是什么?我个人觉得我们应该谨慎、辩证地去思考。这个就相当于从农业社会到工业社会,机器取代了农夫的很多工作,农夫就要到工厂当工人,现在工人的部分工作又被机器人取代了。今天我们是不是能在这个过程中创造出更多的工作,而不只是取代工作。如何让这个技术为全人类社会使用,在这个过程中产生更高的效率,同时能够创造出新的、更好、更有用的工作,让我们每个人都有更好的生活,这是我们需要思考的问题。」
「这不仅仅是开发技术的人的职责,整个社会都要去想,怎么样让这个机器智能最终创造出更多人类社会的福利。」
头图为微软亚洲研究院常务副院长马维英,图片由微软亚洲研究院提供。
已有3条回复我要回复
深入浅出的指出了语义网 知识图谱的核心要义:将智能从算法转移到数据上,而这些智能数据里面最基本的砖块就是三元组了。
人工智能需要三进制机器语言