《最全的AR行业报告.docx》由会员分享,可在线阅读,更多相关《最全的AR行业报告.docx(79页珍藏版)》请在三一办公上搜索。
1、前言继智能手机、平板电脑之后,虚拟现实(VR)与增强现实(AR)有潜力成为下 一个重大通用计算平台。从当前来看,更多的公司选择从 VR 领域进行切入,各大研究公司、投行针对 VR 领域的研究报告也层出不穷,相比之下,AR 领域却稍显平淡。腾讯科技旗下 VR 次元发布全球首份 AR 行业报告,在这份报告中,我们将对 AR 的发展趋势、未来的挑战、潜在应用领域、可能创造和颠覆的市场进行分析和预 测。最后,感谢亮风台研发总监吴仑博士对本报告的支持,吴仑博士撰写了 AR 工作 原理、关键技术相关章节。特别提示:微信上搜索“qqtechvr”,关注“VR 次元”微信公众号,回复“AR”, 即可获得 AR
2、 报告 PDF 版。第一章AR 与 VRVR 和 AR 有着不同的应用领域、技术和市场机会,因此区分两者之间的不同至 关重要。从技术角度来看,AR 是将计算机生成的虚拟世界套在现实世界上,即把数字想 象世界加在真实世界之上。最典型的 AR 设备就是谷歌眼镜。这种智能眼镜将触 控板、摄像头以及 LED 显示器结合起来,通过显示器,用户可以联网,并在视 野内使用地图、电子邮件等服务。其他知名的 AR 产品还有微软的 HoloLens, 创业公司则以 Magic Leap 为典型代表。AR 具备三个主要特征:1、融合虚拟和现实:与 VR 技术不同的是,增强现实技术不会把使用者与真实 世界隔开,而是将
3、计算机生成的虚拟物体和信息叠加到真实世界的场景中来,以 实现对现实场景更直观深入的了解和解读,在有限的时间和有限的场景中实现与 现实相关知识领域的理解。增强的信息可以是与真实物体相关的非几何信息,如 视频、文字,也可以是几何信息,如虚拟的三维物体和场景。2、实时交互:通过增强现实系统中的交互接口设备,人们以自然方式与增强现 实环境进行交互操作,这种交互要满足实时性。3、三维注册:“注册”(这里也可以解释为跟踪和定位)指的是将计算机产生的虚拟物体与真实环境进行一一对应,且用户在真实环境中运动时,也将继续维持 正确的对准关系。VR 是让用户置身于一个想象出来或者重新复制的世界,或是模拟真实的世界。
4、 VR 领域主要的产品包括 Oculus、索尼 PlayStation VR、HTC Vive 和三星 Gear VR。(有关 VR 更多的情况,可关注 VR 次元微信公众号,回复“高盛”和“德 银”,分别获得高盛 VR 中文版报告和德银 VR 中文版报告)区分 VR 和 AR 的一个简单的方法是:VR 需要用一个不透明的头戴设备完成虚 拟世界里的沉浸体验,而 AR 需要清晰的头戴设备看清真实世界和重叠在上面的 信息和图像。从目前来看,AR 比较适合服务企业级用户,而 VR 同时适用于消费者和企业用 户。有些情况下,两者还会出现重叠市场。例如,目前大多数游戏基于 VR 研发, 但微软也用 Ho
5、loLens 重新创作了我的世界这样的游戏。AR 发展简史AR 技术的起源可追溯到“VR 之父”Morton Heilig 在上个世纪五、六十年代所 发明的 Sensorama Stimulator。Heilig 是一名哲学家、电影制作人和发明家。他利用他在电影拍摄上经验设计出了 Sensorama Stimulator,并在 1962 年获得了专利。Sensorama Stimulator 使用图像、声音、风扇、香味和震动,让用户感受在纽 约布鲁克林街道上骑着摩托车风驰电掣的场景。尽管这台机器大且笨重,但在当 时却非常超前。令人遗憾的是,Heilig 没有能够获得所需的资金支持让这个发明 商
6、业化。AR 历史上的下一个重大里程碑是第一台头戴式 AR 设备的发明。1968 年,哈佛 副教授 Ivan Sutherland 跟他的学生 Bob Sproull 合作发明了 Sutherland 称之为“终极显示器”的 AR 设备。使用这个设备的用户可以通过一个双目镜看到一个简单三维房间模型,用户还可以使用视觉和头部运动跟踪改变视角。尽管用户 交互界面是头戴的,然而系统主体部分却又大又重,不能戴在用户头上,只能悬 挂在用户头顶的天花板上。这套系统也因此被命名为“达摩克利斯之剑”。尽管这些早期的发明属于 AR 的范畴,但实际上,直到 1990 年,波音公司研究 员 Tom Caudell 才
7、创造了“AR”这个术语。Caudell 和他的同事设计了一个辅 助飞机布线系统,用于代替笨重的示例图版。这个头戴设备将布线图或者装配指 南投射到特殊的可再用方板上。这些 AR 投影可以通过计算机快速轻松地更改, 机械师再也不需要手工重新改造或者制作示例图版。大约在 1998 年,AR 第一次出现在大众平台上。当时有电视台在橄榄球赛电视 转播上使用 AR 技术将得分线叠加到屏幕中的球场上。此后,AR 技术开始被用 于天气预报天气预报制作者将计算机图像叠加到现实图像和地图上面。从那时起,AR 真正地开始了其爆炸式的发展。2000 年,Bruce H. Thomas 在澳大利亚南澳大学可穿戴计算机实
8、验室开发了 第一款手机室外 AR 游戏ARQuake。2008 年左右,AR 开始被用于地图等 手机应用上。2013 年,谷歌发布了谷歌眼镜,2015 年,微软发布 HoloLens, 这是一款能将计算机生成图像(全息图)叠加到用户周围世界中的头戴式 AR 设 备,也正是随着这两款产品的出现,更多的人开始了解 AR。AR 硬件概览AR 硬件发展的驱动力源于计算机处理器、显示技术、传感器、移动网络速率、 电池续航等多个领域的技术进步。目前能够确定的 AR 硬件类型有以下几种: 手持设备(Handheld Devices) 固定式 AR 系统(Stationary AR Systems) 空间增强
9、现实(SAR)系统(Spatial Augmented Reality Systems) 头戴式显示器(Head-mounted Displays ,即 HMD) 智能眼镜(Smart Glasses) 智能透镜(Smart Lenses)手持设备智能手机正是手持设备的代表。我们正经历着智能手机、平板电脑等手持设备的 大爆炸时代,这将会促进 AR 的普及。这些设备正在变得越来越好显示器分 辨率越来越高,处理器越来越强,相机成像质量越来越好,传感器越来越多,提 供着加速计、GPS、罗盘等等功能这些成为了天然的 AR 平台。尽管手持设 备是消费者接触 AR 应用最为方便的形式,但由于大部分手持设备
10、不具备可穿戴 功能,因此用户无法获得双手解放的 AR 体验。固定式 AR 系统俄罗斯一家 Topshop 内的固定式 AR 衣橱固定式 AR 系统适用于固定场所中需要更大显示屏或更高分辨率的场景。与移动 AR 设备不同的是,这些极少移动的系统可以搭载更加先进的相机系统,因此能 够更加精确地识别人物和场景。此外,显示单元往往能呈现出更加真实的画面, 而且受阳光或照明等环境因素影响较小。空间增强现实(SAR)系统大众公司的 SAR 系统与其它所有系统不同的是,空间增强现实(SAR)系统的虚拟内容直接投影在现实世界中。SAR 系统往往固定在自然中。任何物理表面,如墙、桌、泡沫、木块 甚至是人体都可以
11、成为可交互的显示屏。随着投影设备尺寸、成本、功耗的降低 以及 3D 投影的不断进步,各种全新的交互及显示形式正在不断涌现。SAR 系统 最大的优点在于,现实世界的反射在这里更加精确,即虚拟信息能够以实际的比 例和大小呈现在眼前。此外在观看人数较多时,内容也能看清,这个案例可以用 来实现同步办公。头戴式显示器(HMD)佳能的混合现实头戴设备HMD 代表着另一种快速发展的 AR 硬件类型。HMD 由一个头戴装置(如头盔), 以及与之搭配的一块或多块(微型)显示屏组成。HMD 将现实世界和虚拟物体 的画面重叠显示在用户视野中。换而言之,用户不会直接看到现实,看到的是现 实的增强视频画面。如果显示屏只
12、覆盖用户的一只眼睛,这样的 HMD 称为单眼HMD,另一种是两只眼睛都看显示屏的双眼 HMD。先进的 HMD 通常能够搭载具有很高自由度的传感器,用户可以在前后、上下、左右、俯仰、偏转和滚动 六个方向自由移动头部。该系统因此能够实现虚拟信息与现实世界的贴合,并根 据用户头部移动作做相应的画面调整。智能眼镜Vuzix M100 智能眼镜消费电子行业的许多公司认为,智能眼镜将会成为智能手机后下一大全球热卖消 费产品。这些 AR 设备实际上是带有屏幕、相机和话筒的眼镜。根据这一概念, 用户的现实世界视角被 AR 设备截取,增强后的画面重新显示在用户视野中。AR 画面透过眼镜镜片,或者通过眼镜镜片反射
13、,从而进入眼球。智能眼镜技术最为 突出的例子是谷歌眼镜和 Vuzix M100。不过,目前开发中的最令人激动的智能 眼镜要数 Atheer One该智能眼镜配有 3D 景深传感器,用户可以实际控制 眼前显示的虚拟内容。智能透镜华盛顿大学开发的透镜中含有金属电路结构智能眼镜绝不是故事的结局。越来越多的研究投入到能显示 AR 画面的智能透镜 上;微软、谷歌等公司也正忙于宣布自己的智能透镜项目。智能透镜的理念是在传统透镜中集成控制电路、通信电路、微型天线、LED 及其 它光电组件,从而形成一套功能系统。未来或许可以用成千上万颗 LED 直接在 眼前形成画面,从而让透镜变成显示屏。然而,还必须克服一系
14、列难题,比如说 如何给透镜供电,如何保证人眼不受伤害等等。在这一章的最后,我们简单看下 AR 技术会应用到哪些领域:考古:在古代遗迹上显示遗迹原本的样子。艺术:跟踪眼球移动并将这些移动显示在屏幕上,帮助残疾人进行艺术创作。商业:显示产品的多种定制选项或者补充信息。教育:将文本、图像、视频和音频叠加到学生周围的实时环境中。时尚:显示不同的妆容和发型用在一个人身上的效果。游戏:运用真实世界环境让用户在游戏中进行互动,获得不同的体验。医药:通过虚拟 X 光将病人的内脏器官投射到他们的皮肤上。军事:使用 AR 眼镜向士兵展示战场中出现的人和物体,并附上相关信息,以帮 助士兵避开潜在的危险。导航:将道路
15、和街道的名字跟其他相关信息一起标记到现实地图中,或者在挡风 玻璃上显示目的地方向、天气、地形、路况、交通信息,提示潜在危险。体育:显示橄榄球场的得分线、高尔夫球的飞行路线和冰球移动的轨迹。电视:在天气预报中显示天气视觉效果和图像。第二章AR 的工作原理AR 介于 VR 和真实世界之间,VR 创造逼真的虚拟世界,AR 则将图形、声音、 触感和气味添加到真实的世界中。在介绍 AR 的工作原理之前,我们先通过一个例子,让大家有一个简单的认识。在 2009 年 2 月的 TED 大会上,帕蒂梅斯(Pattie Maes)和普拉纳夫米斯特 莱(Pranav Mistry)展示了他们研发的 AR 系统。该
16、系统属于麻省理工学院媒 体实验室流体界面小组的研究成果之,他们称之为 SixthSense(第六感)。它依靠众多 AR 系统中常见的一些基本元件来工作:摄像头、小型投影仪、智能手机和镜子。这些元件通过一根类似绳索的仪器串连起来,然后戴在佩戴者的脖子上。用户还 会在手指上戴上四个不同颜色的特殊指套,这些指套可以用来操纵投影仪投射的 图像。SixthSense 设备利用简单的、现成的元件来组成 AR 系统,它的投影仪可以将 任何平面变成一个互动的显示屏。SixthSense 设备利用摄像头和镜子来捕捉周 围的环境,然后将这种图片传给手机(手机处理这种图片,获得 GPS 坐标以及 从互联网上搜索相关
17、信息),然后将这些信息从投影仪投射到用户面前的任何平 面上,不管这种平面是一个手腕,一面墙,还是一个人。由于用户将摄像头佩戴 在胸前,因此 SixthSense 设备能够增强他所看到的一切。例如,如果他在一个 杂货店里挑选了一罐汤,SixthSense 设备将能够搜索这罐汤的相关信息,例如 成分、价格和营养价值甚或用户评论,然后将它们投射到平面上。利用手指上的指套,用户可以在投射的信息上执行各种操作,这些操作将会被摄 像头捕捉到,然后通过手机来处理。如果他希望了解这罐汤的更多信息,例如与 之竞争的同类产品,那么他可以用手指与投射画面进行互动,从而获取更多的信 息。SixthSense 设备还能
18、够识别一些复杂的手势,例如你在手腕上画一个圆圈, SixthSense 设备就能够投射一款手表来显示当前的时间。AR 的系统结构一个典型的 AR 系统结构一个典型的 AR 系统结构由虚拟场景生成单元、透射式头盔显示器、头部跟踪设 备和交互设备构成。其中虚拟场景生成单元负责虚拟场景的建模、管理、绘制和 其它外设的管理;透射式头盔显示器负责显示虚拟和现实融合后的信号;头部跟 踪设备跟踪用户视线变化;交互设备用于实现感官信号及环境控制操作信号的输 入输出。首先透射式头盔显示器采集真实场景的视频或者图像,传入后台的处理单元对其 进行分析和重构,并结合头部跟踪设备的数据来分析虚拟场景和真实场景的相对 位
19、置,实现坐标系的对齐并进行虚拟场景的融合计算;交互设备采集外部控制信号,实现对虚实结合场景的交互操作。系统融合后的信息会实时地显示在头盔显示器中,展现在人的视野中。AR 的关键技术目前 AR 技术的技术难点在于:精确场景的理解、重构和高清晰度、大视场的显 示技术。1、 对现实场景的理解和重构在增强现实系统中,首先要解决“是什么”的问题,也就是要理解、知道场景中 存在什么样的对象和目标。第二要解决“在哪里”的问题,也就是要对场景结构 进行分析,实现跟踪定位和场景重构。物体的检测和识别技术物体检测和识别物体检测和识别的目的是发现并找到场景中的目标,这是场景理解中的关键一环。 广义的物体检测和识别技
20、术是基于图像的基本信息(各类型特征)和先验知识模 型(物体信息表示),通过相关的算法实现对场景内容分析的过程。在增强现实 领域,常见的检测和识别任务有,人脸检测、行人检测、车辆检测、手势识别、 生物识别、情感识别、自然场景识别等。目前,通用的物体检测和识别技术,根据不同的思路可以分为两种:一种是从分 类和检测的角度出发,通过机器学习算法训练得到某一类对象的一般性特征,从 而生成数据模型。这种方法检测或者识别出的目标不是某一个具体的个体,而是 一类对象,如汽车、人脸、植物等。这种识别由于是语义上的检测和识别,所以 并不存在精确的几何关系,也更适用于强调增强辅助信息,不强调位置的应用场 景中。如检
21、测人脸后显示年龄、性别等。另外一种识别是从图像匹配的角度出发, 数据库中保存了图像的特征以及对应的标注信息,在实际使用过程中,通过图像匹配的方法找到最相关的图像,从而定位环境中的目标,进一步得到识别图像和目标图像的精确位置,这种识别适用于需要对环境进行精确跟踪的应用场景。就现阶段而言,识别检测技术的难点之一是技术的碎片化。这一方面是由于每一 类对象都会有其独有的特征,而不同特征的提取和处理都需要实现一一对应,这 对识别检测是一个巨大的挑战。另一方面,图像本身还受到噪声、尺度、旋转、 光照、姿态等因素的影响。近几年来,随着深度学习技术的不断成熟,检测和识 别方法也越来越统一,而性能也在不断提高中
22、。跟踪定位技术跟踪技术的方法可以分为基于硬件和基于视觉两大类。基于硬件设备的三维跟踪 定位方法在实现跟踪定位的过程中使用了一些特殊的测量仪器或设备。常用的设 备包括机械式跟踪器、电磁式跟踪器、超声波跟踪器、惯性跟踪器以及光学跟踪 等。光学跟踪和惯性跟踪是比较常用的两种硬件跟踪方式,HTC Vive 就是采用 了光学跟踪和惯性跟踪两种硬件来定位头部的位置。使用硬件设备构成的跟踪系 统大多是开环系统,跟踪精确取决于硬件设备自身的性能,其算法的扩展性要差 一些,且成本相对较高。HTC Vive 采用光学和惯性跟踪设备视觉跟踪方法具备更强的扩展性,其系统多为闭环系统,更依赖于优化算法来解 决跟踪精度问
23、题。相比于上述基于硬件设备的跟踪方法,计算机视觉跟踪方法提 供了一种非接触式的、精确的、低成本的解决方法,但是基于视觉的方法受限于 图像本身,噪声、尺度、旋转、光照、姿态变化等因素都会对跟踪精度造成较大 的影响,因此更好地处理这些影响因素,研发鲁棒性强的算法就成为下一步 AR 技术的研究重点。根据数据的生成方式,视觉跟踪技术的算法可以分为两种,一种是基于模板匹配 的方式,预先对需要跟踪的 target 进行训练,在跟踪阶段通过不断的跟预存训 练数据进行比对解算当前的位姿。这类方法的好处是速度较快、数据量小、系统 简单,适用于一些特定的场景,但不适用于大范围的场景。另外一种是 SLAM 方法,也
24、就是即时定位和地图构建技术。这类技术不需要预 存场景信息,而是在运行阶段完成对于场景的构建以及跟踪。其优点是不需要预存场景,可以跟踪较大范围,适用面广,在跟踪的同时也可以完成对于场景结构的重建。但目前这类技术计算速度慢、数据量大、算法复杂度高,对于系统的要 求也较高。Hololens 和 Magic Leap 的宣传视频中都展现了这方面技术,而亮 风台对相应的技术也在研发当中。SLAM 跟踪技术为了弥补不同跟踪技术的缺点,许多研究者采用硬件和视觉混合跟踪的方法来取 长补短,以满足增强现实系统高精度跟踪定位的要求。2、增强现实的显示技术透射式头盔显示器透射式头盔显示器 Hololens目前大多数
25、的 AR 系统采用透视式头盔显示器实现虚拟环境与真实环境的融合。 根据真实环境的表现形式划分,主要有视频透视式头盔显示器和光学透视式头盔 显示器两种形式。视频透视式头盔显示器通过安装在头盔上的微型摄像头获取外部真实环境的图 像,也就是通过摄像头来采集真实场景的图像进行传递。计算机通过场景理解和 分析将所要添加的信息和图像信号叠加在摄像机的视频信号上,将计算机生成的 虚拟场景与真实场景进行融合,最后通过类似于浸没式头盔显示器的显示系统呈 现给用户。虽然视频透射式头盔在显示上不受强光的干扰,具有比较大的视场,但由于真实 环境的数据来自于摄像头,因此会造成显示分辨率较低的不利因素。另一方面, 一旦摄
26、像机与用户视点不能保持完全重合,用户看到的视频景象与真实景象将会 存在偏差,因此会造成在某些领域(特别是工业、军事等领域)出现一些安全隐患。光学原理的透视式头盔显示器的基本原理则是通过安装在眼前的一对半反半透 镜融合呈现出真实场景和虚拟场景。与视频透射式不同的是,光学透视式的“实” 来自于真实的光源,经过透视光学系统直接进入眼睛,计算机生成的“虚”则经 过光学系统放大后反射进入眼睛,最后两部分信息汇聚到视网膜上从而形成虚实 融合的成像效果。光学透视式头盔相对来说结构简单,分辨率更高,因其能够直接看到外部,真实 感和安全性也更强。其缺点是,在室外强光条件下显示效果会受影响。目前 Hololens
27、 以及亮风台的 HiAR Glasses 都采用了光学透射式的成像方案。不难看出,两种方案各有优缺点,如何选择最优方案,目前来看,还应基于实际 应用场景来进行判断。由于光学透射式头盔跟实际场景结合更紧密,真实感更强,大多数厂家会选择这 种方案。对于透射式头盔显示器来说,单纯的强调厚薄或者视场大小并没有任何 实际意义。这是由于厚度和视场是矛盾的,要做得较薄,方便用户使用佩戴,视 场就必然变小;想要拥有大视场,则其厚度就必然增大,设备就目前来说也会显 得比较笨重,不易佩戴。因此在目前技术依旧存在障碍的情况下,大家都会采取 一些折中的方案。数字光场显示Magic leap 光场显示随着 Magic
28、Leap 的宣传视频,数字光场这个概念也变得广为人知。这种不采用 屏幕来做载体的显示方式,通过记录并复现光场来完成虚拟物体的显示。通过呈 现不同深度的图像,使用户在观察近景或远景时,可以实现主动的对焦,这也是 光场显示的一大优点。同样,光场显示也有不同的显示方案,一种方案是采用多层的显示器,如光场立 体镜。如 Magic Leap 采用的是光导纤维投影仪。这套方案的优势是可以做到很 大的视场角,显示更加符合人的真实感受。但这一方案同时也具有比较大的挑战 性,光场的显示需要比较大的计算量,并且需要有相应的手段记录或者生成想要 叠加的虚拟对象相应位置的光源信息,同时还要精细地控制投影的内容和位置,
29、目前这些技术还都处于研究阶段。尽管存在比较多的挑战,光场显示技术仍旧是非常值得期待的一种成像方式。第三章布局从目前来看,绝大多数巨头和创业公司更愿意选择在 VR 领域开疆拓土,但这并 不意味着 AR 无人问津。苹果种种迹象显示,苹果可能和微软一样瞄准了 AR 领域,并非时下最热的 VR。苹果已经在 AR 领域进行过一些并购交易。2015 年 5 月,苹果收购了一家名为 Metaio 的德国 AR 公司。该公司主要开发基于智能手机的 AR 应用软件,比如 其曾经开发一款让家具视觉化呈现的工具。该公司被收购之后,实体被注销,人 员融入了苹果的开发团队。2014 年年底,苹果收购了一家从事脸部视觉识
30、别的公司FaceShift,该公司的技术能够利用摄像头对用户脸部图像进行实时捕捉,甚至可以生成虚拟的头像。 据悉,电影星球大战:原力觉醒的特效团队曾经使用了上述公司的技术,让 外星人的脸部形象更加栩栩如生。此外,苹果还曾经收购了以色列的硬件公司 PrimeSense,该公司主要为微软的Xbox 游戏机制造 Kinect 动感捕捉摄像头。该公司具备了先进的手势动作识别技术。在 AR 领域,用户一般不会使用手持控 制器,因此识别手部动作十分重要,这一技术也能够用于 AR 头盔中。除了各种并购之外,苹果也储备了一些和 AR 有关的技术专利。这些专利并不意 味着苹果一定会开发某种技术或者硬件,但是可能
31、披露了苹果未来产品开发的某 些思路。2015 年 2 月,苹果获得一个技术专利,主要用于让智能手机连接 AR 和 VR 头 盔。专利描述文字和谷歌、微软、三星电子和 Facebook 近些年推出过的产品十 分相似。不过迄今为止,苹果从未对外宣布过开发 AR 硬件、软件等产品的计划。苹果向 来并不喜欢做新技术的第一批尝鲜者,而是善于在市面已有的产品门类中拿出用 户体验十分优秀的产品,依靠苹果的品牌力大规模占领市场。因此在 AR 领域, 苹果也会选择一个相对成熟的时机再进入市场。微软微软应该算是布局 AR 比较超前的巨头公司,其在 2015 年就推出了 AR 头盔HoloLens,开发者版已经开启
32、预订,售价为 3000 美元。我们之所以能够看到物体,是因为光线被这些物体反弹,最后射入我们的眼中。 而我们的大脑需要对这些光进行复杂运算,最后重现你眼睛所看到物体的图像。 HoloLens 实际上就是欺骗大脑,将光线以全息图的方式发射到你眼睛中,就好 像物体真的存在于现实世界中一样。就像下面这幅图,HoloLens 可以将屏幕投射到墙上。当用户四处走动时,屏幕 依然会留在原地,就好像那是一面真实存在的镜子。HoloLens 可在正确角度向 你的眼中发射光线,让你觉得屏幕真的出现在墙上。HoloLens 本身就是一台独立电脑,拥有自己的 CPU 和 GPU,以及微软所谓的 全息处理单元,负责支
33、持创造全息图必须的全部必要计算。在消费者方面,HoloLens 拥有巨大潜力,你可能再无需购买 60 英寸电视,HoloLens 允许用户将电视屏幕发射到墙上,屏幕大小可随意调节。如果未来版的 HoloLens 足够紧凑,你可以想象到有人边开车边接受导航,但司机的实现不 再局限于屏幕上,而是可看到前方道路的全息图。当然,游戏可能是 HoloLens 的重要卖点。在企业方面,HoloLens 最明显的应用就是实现 3D 模型或设计的可视化。 HoloLens 也可被用于视频会议等场合。此外,它的另一个用途可能是支持在线 零售店,允许 HoloLens 用户看到其产品全息图。在你购买家具前,你就可
34、以看 到家具被摆放在室内的虚拟图。由于 HoloLens 运行 Windows 10 操作系统,通用应用将可在其上顺利运行。 这些应用将被投射到用户面前,可被便捷操作。对于微软来说,吸引开发者非常 重要,因为这款设备最吸引人的应用可能还未出现。尽管 HoloLens 的硬件设施 令人印象深刻,但其依然需要好的应用为消费者和企业提供最好的服务。微软手中可能正握着一款革命性产品。在错失了移动大潮之后,微软将复兴的希 望押在 HoloLens 身上,尽管在 HoloLens 成为大众设备前,它可能需要数次迭 代,但对于微软来说,这将是改变游戏规则的良机。谷歌谷歌当前在 VR 领域比较活跃,如推出硬件
35、产品 Cardboard 头盔,YouTube 上线 360 度全景视频功能,还提供 Tilt Brush、Jump 和 Assembler 等 VR 小应用,方便帮助开发者创新新的 VR 体验,但这并不意味着谷歌放弃了 AR 市场。谷歌和联想合作,推出 Project Tango 项目。该项目旨在赋予智能手机 3D 绘图 和创造 AR 体验的能力。Tango 智能手机将于今年年终发货,相当于是一个完整 功能的 AR 设备。除了自身开发 AR 项目,谷歌还投资了 AR 创业公司 Magic Leap。Magic Leap 专注于 AR 技术的研发,其最终产品很可能是一款头盔,可将电脑生成的图像
36、投 射到人眼上,最终在现实图像上叠加一个虚拟图像。有关 Magic Leap 的情况, 将在下文进行详细说明。Magic LeapMagic Leap 算是知名度很高的 AR 创业公司。今年 2 月,Magic Leap 在新一 轮融资中获得 7.935 亿美元的投资,阿里、谷歌都参与了本轮融资。据估测, Magic Leap 的估值至少达到 45 亿美元,这比两年前 Facebook 收购 Oculus 的价格高出了两倍。Magic Leap 研发的技术依然处于半透明状态,没有任何产品出现,我们目前只 知道它主要研发方向就是将三维图像投射到人的视野中。Magic Leap CEO 鲁尼 阿伯
37、维兹曾公开表达过自己公司的定位:“你可以将我们看作是科技生物学(Techno-biology),我们认为它是计算机的未来。”具体来说,Magic Leap 制作图像的方法与人眼的工作方式相同。Magic Leap 利用弯曲的光场制作图像,而不像其他平台那样利用立体图像欺骗眼球。利用其 他 3D 图像投影方式,如果用户闭上一只眼睛,3D 图像就会消失。在现实生活 中,用户即使闭上一只眼睛,依然能够看到 3D 图像。Magic Leap 便采用这种 更为实用的图像制作方式。第四章:AR 市场潜力尽管过去一年里媒体开始大肆报道 AR 技术,我们目前了解到的大部分 AR 解决 方案仍处于开发之中。只有
38、少数硬件解决方案得到了大规模生产并能够买到。2011 年,全球 AR 营收仅为 1.81 亿美元,而且当时 AR 往往被人们视作一种营 销噱头:一种还在摸索实用应用的技术。很少有人认识到 AR 的潜力,开发相关 应用大多也是用来快速打响名声,或者这些应用的价值仅限于添加视频效果这样 的博眼球之举而已。然而最新预测指出,到 2017 年,AR 市场将增长至 52 亿美元,年增长率竟逼近 100%。随着大量资金注入 AR 项目及 AR 创业公司,尤其是随着谷歌、佳能、高通、微软等大公司的入场,我们已经看到第一批消费级 AR 产品的涌现。随着实际商业利益的出现, AR 将成为消费、医疗、移动、汽车以
39、及制造市场中的“下 一件大事”。AR 比 VR 更具增长潜力市场调研公司 Digi-Capital 给出的一组数据很值得研究:到 2020 年,AR 的市 场规模将达到 1200 亿美元,远高于 VR 的 300 亿美元。VR 对于游戏与 3D 电影来说是一项非常棒的技术,甚至可以说这项技术可谓是 专门为此而设计的。但这项技术的体验主要是在客厅、办公室或者座位上展开的, 因为如果你戴着一个完全封闭的头戴式显示器走在路上,随时都可能撞到路边的 东西。虽然 AR 技术应用在游戏也非常有趣,但在需要真正沉浸式体验的时候,其所带来的乐趣或许不如 VR 技术那么多,这就像是移动游戏与主机游戏之间的差距。
40、 但是,AR 技术在游戏玩家眼中的这个缺点,恰恰是让它可以同智能手机一样, 在数以亿计用户的现实生活中发挥重要作用的优势。人们可以戴着它四处活动, 做任何事情。AR 的软件与服务拥有可与如今的移动市场相媲美的经济效应,它们都可以利用 现有的其他产品的市场,并不断扩张它们。AR 庞大的用户基础将会成为电视电 影、广告以及 Facebook 的用户应用程序甚至部落冲突等游戏的主要收入来 源。换句话说,AR 技术有可能触及到更多的人,因为它是对人们日常生活的无缝补 充,而不是像 VR 那样在现实世界之外营造出一个完全虚拟的世界。增强现实:指向增强现实的一种新技术一书的作者格里格基佩尔(Greg Ki
41、pper)在书中写到:“增强现实将具备更多的实际应用价值,因为在现实中, 与真实世界中的事物互动的人更多一些。”在增强现实技术的帮助下,人们通过专用头盔看见的三维全息图像可以为真实世 界提供一种有益的补充。当你走过一个杂货店的走道,你也许会在眼前的虚拟屏 幕上看到制作意大利饭所需的食材和配料清单。又或者,当你在阅读一本有关天 文学的书籍时,你周围可能会出现一幅太阳系的图像。但是戴上虚拟现实头盔之后,你与周遭世界的联系就被人为隔断了。你被投影到一个不同的世界中,就像恐龙冲过一片丛林,或者像站在一幢 100 层的摩天大 楼的楼顶上俯瞰着脚下的大街一样。这跟主题乐园的游历过程有些相似,就连虚 拟现实
42、头盔戴久了会让你感到恶心或者头晕也跟你在主题乐园中呆久了的感觉 很相似。Meta 是硅谷的一家小公司,员工人数大约为 100 人。按计划它将在今年夏天交 付第二代 AR 头盔,它的头盔是作为开发者工具套装的一部分出售的,整个套装 售价 949 美元,主要用来帮助开发商为新头盔设计出更多的三维、互动应用。Meta CEO 梅隆格里贝茨预计,有朝一日,人们再也不用一边在笨拙的键盘上 敲敲打打,一边紧盯着显示屏的屏幕,人们可以在漂浮在眼前的全息图像之间随 意切换和浏览,只需用手碰一碰就可以完成各种操作。当然还有虚拟键盘,人们 可以利用它输入数据。人们可以进入他们的全息影像屏幕,提取出人的解剖图,然后
43、剔除骨骼进行研究。 人们也可以通过透视去检查自己打算购买的鞋子的内部做工。到那个时候,打电 话将会变成一种很奇怪的行为,因为所有人都可以在全息影像中进行对话。格里贝茨说:“VR 很酷,但它只是通向增强现实的一块垫脚石。我们将开发出比 Mac 电脑好用一百倍且强大一百倍的产品。”第五章:AR 面临的挑战对于 AR 而言,解决注册任务是最核心的问题。注册对精度的要求极为严格:由 于 AR 应以实时、六个自由度的形式将虚拟信息和现实信息相融合,即便是轻微 的注册失准都会造成组合视图难以容忍的失真。因此,移动 AR 存在两大难点: 注册必须极为精准,注册对计算能力和内存的利用必须极为高效。这个问题是
44、AR 面向大众部署所面临的终极挑战。我们断言,目前大部分已知的 注册任务解决方案其实并不适用于智能手机尽管看上去能用。因此,所有的 AR 研究人员都应该为智能手机 AR 的大空间应用问题开发专门的解决方案。智能手机是 AR 大众市场最具前景的平台。智能手机生态系统为面向大众部署 AR 的纯软件解决方案提供了一切要素。然而不应忽视的是,尽管技术和逻辑取 得了种种进步,但是 AR 应用在智能手机上的大规模部署仍然存在着下列重大障 碍:1、相机质量与成像处理。智能手机通常配备的相机传感器在弱光条件下表现糟 糕:图像模糊,开始出现明显色差。相机传感器硬件通常禁止低层级访问。API 只提供了相机传感器的
45、高层级访问,无法控制曝光、光圈及焦距。小型 CCD 传 感器导致相机采样噪点增加,进而严重影响后续 CV 算法的发挥。图像获取过程 中的质量损失很难通过后期处理步骤补偿。2、电量消耗。电池电量近年来并没有显著提升。相机传感器在以高帧率持续运行时耗电量很大,其主要原因是目前手机的设计用途仍然是拍照,而不是摄影。 另外,传感器和网络接口也是耗电大户。运行功能强大的 AR 应用会让电池迅速 耗干。因此,AR 应用必须只能设计成供短时间使用,而不是一种“常开”功能。3、网络依赖性。远程访问大量数据受到几个因素的影响。首先,网络延迟会导 致令人不爽的延迟,拖累 AR 应用的瞬时表现。其次,访问远程数据仅
46、在开了流 量套餐时才有可能做到,而流量套餐可能过于昂贵或者无法开通。最后,某些地 区的网络覆盖可能不满足条件。于是完全独立的 AR 应用成为了唯一的可行选择, 这就意味着需要在设备上占用大量的存储空间。4、可视化与交互的可能性。智能手机的外形因素在购买决策中发挥着重要作用。 实际上,可接受最大设备的尺寸严格制约了显示屏的大小。交互技术同样存在着 类似的限制。多点触控界面或许是最为先进的交互机制,但它在某些特定任务如像素级的选取上表现糟糕。理论上讲,针对 AR 改进未来智能手机需从哪些方面入手已是众所周知。在实践 中,AR 应用的开发者却要看硬件厂商和服务供应商的脸色,后者做出硬件发展 决策的依据是市场预测,而其中可能不含对