[核心提示] Google Glass 引发了无数科技猜想,但它仅仅只是一个简单的可穿戴式设备吗?它会给我们的生活带来什么样的变化?
自 Google Glass 发布概念视频起,关于 Google Glass 及视觉搜索的讨论便不绝于耳。百度在愚人节当天发布了 Baidu Eye 的照片,虽说许多人以为这只是百度的愚人节玩笑,但也有人士称得到百度内部员工证实,百度的确已经研发了这样一款产品,而且是故意在愚人节发布此消息。
目前关于Baidu Eye的消息可谓亦真亦假,但业界对于可穿戴式设备尤其是初步成型的 Google Glass 的超高热情却是真的。Google 目前也在向大众寻求 Google Glass 的创意使用方式,许多人也发表了自己的种种设想,如拍照、导航、翻译、医疗手术乃至帮助警察锁定犯人等等。但这些使用方式实在稀松平常,基本都没有走出传统手机应用的桎梏,只是将智能机上的使用方式移植到 Google Glass。
但我认为基于 Google Glass 等可穿戴式设备的应用将颠覆目前的移动设备使用方式,下面我将根据受到的启发介绍几种 Google Glass 的创意使用方式。你将看到,Google Glass,远非一部可穿戴式手机那么简单。
一、Google Glass与自闭症
很多人可能听过自闭症这个词,但未必理解其内涵,因此我们先介绍一点自闭症的基本知识。
据维基百科介绍:
自闭症被归类为一种由于神经系统失调导致的发育障碍;
成长发育中婴儿具有社交能力,年纪小懂得望人、按声音方向转身、抓着别人的手指,甚至微笑。可是,自闭症患者喜欢避开望人,而且在学习与人发展‘施及受’的互动时有困难;
根据赛门·巴隆-柯亨的研究,自闭症病童缺乏“心智理论”的特质,即由他人的角度看事情,而这种行为是五岁以上的人类及部分高等灵长类生物所独有的。正常的五岁小童可根据解读他人的手势、面部表情等社交线索,估计他人的知识水平、感觉和意图等等。而自闭症病童缺乏这种解读能力,故此他们难以估计及明白他人的行为。
按照英国心理学家西门·巴伦科恩的话说,患有自闭症的病人存在“思维盲区”。正常人与生俱来、自动自发的能力,在自闭症患者看来却是难以企及的。他们很难读懂诸如手势和面部表情等非语言类的信号,也很难从他人的角度看待问题,另外也不善于理解任何超越字面意思的词句,他们发挥直觉的器官已经基本丧失了功能。
耶鲁大学的罗伯特·T·舒尔茨曾使用功能磁共振成像仪(FMRI,一种非常精密的脑部扫描仪,能够显示脑部血液在任意指定时间点的流向,并由此显示大脑的哪些部位正处于工作状态)做过一项实验,他让实验对象进入成像仪机仓中,用按钮的方式来表示他们所看到的两张面孔或两个物体(如椅子、箱子等)是否相同。实验发现,普通人在看到人脸时所用的大脑部位称为“梭状回”,是一个极其精密的大脑部件,能让我们从大量面孔中进行分辨。然而当正常实验对象看到一把椅子时,他们所采用的是相比之下全然不同的大脑区域,即通常用来观察物体的“颞下回”。但是当实验对象为自闭症患者时却发现这些患者在看到椅子和人脸时使用的都是大脑中观察物体的“颞下回”!也就是说,在自闭症患者看来,人脸和一把椅子差不多是一回事。在他们看来,人类跟一块会说话的木头差不多。但我们知道正常人是可以从人类的言谈举止、姿态仪容中读出很多隐含的意义的。
以上是关于自闭症的基础知识,下面谈谈解决方案。该方案主要基于心智解读理论,跟它有点类似的一个词叫做“读心术”。该理论主要源于西尔凡·汤姆金斯和保罗·艾克曼师徒,汤姆金斯认为我们能从人的面部表情中获取有效的线索,从而得以分析内心的情感和动机,甚至对马也是如此。汤姆金斯对人类面部表情规律的研究折服了艾克曼,艾克曼与同事也通过学习掌握了这套规律,并创建了一个面部表情分类系统。他们查遍医学教材,找出了所有面部能够做出的肌肉活动,这些肌肉活动更有 43 种,被艾克曼称之为表情动作单元。通过长时间的练习,他们掌握了全套的动作单元,并对不同单元进行混合搭配,把各个动作叠加。因为两块肌肉之间就有 300 种组合方式,三块肌肉则会产生 4000 种搭配,他们最多组合了五块肌肉的活动,这个组合产生的可供眼部识别的面部表情有1万多种。最后,剔除其中大部分的没有实际意义的表情后,艾克曼制成了一份人类面部基本表情目录表,将这些动单元及其解读法则全部汇总在一起,编制成了脸部动作编码系统(FACS),不少科研工作曾借鉴过这套系统。
其实这套方案的解决方法就是利用 Google Glass 检测并识别人的脸部表情、手势等,接入艾克曼的脸部动作编码系统(FACS),将人的表情、手势等翻译为直白的语言信号,以适当方式呈递给自闭症患者。说白了,就是利用 Google Glass 及其检索翻译系统充当自闭症患者的“梭状回”,以技术手段弥补先天不足,有点类似假肢的作用。
我是相信心智解读理论的,我相信通过人的面部表情,我们能够判断一个人的笑容是真诚的还是强迫挤出来的。即使我们能够控制面部肌肉或者言谈举止,但一部分被抑制的感情还是时常会暴露出来,抓住这些微妙的变化,我们就能更好地理解人世常情,那些丧失基本心智解读能力的自闭症患者也能回归正常生活。
但是要真正实现这个解决方案还有以下几个问题:
-
目前的摄像头水平可能达不到识别要求,要精确识别脸部特殊突起和褶皱可能需要较高的分辨率。关于这一点,我没查阅到具体的科学研究表明需要多高的摄像头水平,所以只是说这可能是限制。不过也许千万乃至几百万像素就足够了。或者可以通过其他传感器来实现面部肌肉变化的检测。
-
方案的实现很大程度上依赖于接入艾克曼的脸部动作编码系统(FACS),但据说全球仅有 500 人有资格在研究中使用这套系统。不知为什么这套系统没有开放给所有人,所以要想借鉴,还需要与该系统拥有者谈判。
-
伦理问题。如果此项解决方案真的有效且能实现,那么任何谎言都将逃不过 Google Glass 使用者的“法眼”。善意的谎言不再美丽,新的人际交流障碍不断涌现,每个人都在“裸奔”。当然这也许不是问题,可以通过别的方案来弥补和解决,比如说设定此功能的权限,仅开放给自闭症患者或其他有必要使用的人员,限制系统的解读能力等。
除了用于自闭症患者,Google Glass 还可以用于许多其它场合。例如辅助医生治疗精神类疾病患者,因为这些人群常有自杀倾向,甚至可能装作病症缓和的样子使医生放松警惕,以寻找机会自杀。如果医生使用了 Google Glass,那么就能抓住患者的细微表情,了解其内心真实意图,向医生发出警报,从而挽救许多生命。再比如,警察在审讯犯人时,很可能被那些具有表演天赋的罪犯所欺骗,放过坏人,造成冤假错案等,但是有了 Google Glass 辅以测谎仪,犯罪分子将难逃法网。
二、手语翻译
既然 Google Glass 能够识别面部表情、手势等,那么自然可以用它来实现聋哑人的手语翻译问题。只要将手语专家的手势及其解读法则录入系统,就能轻松实现手语翻译,比脸部表情识别简单得多。
三、唇语翻译
既然 Google Glass 能够识别面部细微的肌肉变化,那么检测嘴唇周边肌肉的变化也不成问题,因此翻译唇语亦成为可能。传统的语音识别仅仅依靠音频数据进行分析,虽然目前准确率已经较高,但并不完美。如果能加入 Google Glass 的唇语翻译,使音频语音识别与视频语音识别相结合,那么语音识别的准确率将达到一个全新的高度。
四、完美的骨传导设备
在前文介绍使用 Google Glass 充当梭状回治疗自闭症时,我将它比作假肢,是人体的器官。而根据眼镜这种物品的特性,Google Glass 还是完美的骨传导设备——它可以充当人类的耳朵。
骨传导技术在通讯工具中的应用已经有一段历史了,最早可追溯到 2003 年日本三洋公司推出的第一款骨传导手机,但之后该技术基本销声匿迹,直到 2012 年京瓷又推出一款骨传导手机 Urbano Progresso,再次引发关注。
在手机上使用骨传导技术有点怪怪的,感觉不是很自然,因为要将手机尽量贴近耳朵才会有更好的效果。但是将 Google Glass 作为骨传导技术的载体堪称完美。眼镜手柄天然贴合耳朵附近的骨头,几乎不需修改外形。该技术不仅会成为耳聋患者的福音,对于提高在嘈杂环境中的通话质量也极有意义。随着世界尤其是中国逐渐进入老龄化社会,有听力障碍的人群将不再是少数,从商业价值角度来看,在 Google Glass 中引入骨传导功能是一片值得深度探索的市场蓝海!
五、颠覆教育
以上四种使用方式基本都是在不引入外部硬件的基础上实现的,如果将来在 Google Glass 中加入一些硬件,那它的想象空间将更大,这里只举一小例目前看来有希望投入应用的硬件。
相信很多人都知道视线追踪技术,如果 Google Glass 能够引入支持此种技术的硬件,在不阻挡视线不引致分心的前提下,捕捉到使用者的视线关注区域,那至少将颠覆教育行业。例如,儿童学习时遇到不认识的字词,视线扫过那个字 Google Glass 就能将发音、用法等信息传达给他,这将在一定程度上解放父母,大有“哪里不会看哪里,so easy”的意味。又或者当我们看到某种不认识的事物,如花草树木,只要视线扫过它们,Google Glass 就能告诉你它的相关信息,当然这也可能通过 Google Glass 目前的摄像头拍照然后与相应数据库对接搜索实现,但精确效果不如前一种方法。
以上对于 Google Glass 的探讨完全是本人基于所掌握知识所作出的的一番猜想,可能其中对于某些专业知识的理解还存在欠缺,所以若有不合理之处还请指正,欢迎大家与我讨论。如欲拍砖,请轻拍。
已有9条回复我要回复