2018年电子元器件行业智能音箱研究报告(3)DOC.docx

上传人:牧羊曲112 文档编号:1844465 上传时间:2022-12-21 格式:DOCX 页数:53 大小:964.91KB
返回 下载 相关 举报
2018年电子元器件行业智能音箱研究报告(3)DOC.docx_第1页
第1页 / 共53页
2018年电子元器件行业智能音箱研究报告(3)DOC.docx_第2页
第2页 / 共53页
2018年电子元器件行业智能音箱研究报告(3)DOC.docx_第3页
第3页 / 共53页
2018年电子元器件行业智能音箱研究报告(3)DOC.docx_第4页
第4页 / 共53页
2018年电子元器件行业智能音箱研究报告(3)DOC.docx_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《2018年电子元器件行业智能音箱研究报告(3)DOC.docx》由会员分享,可在线阅读,更多相关《2018年电子元器件行业智能音箱研究报告(3)DOC.docx(53页珍藏版)》请在三一办公上搜索。

1、2018年电子元器件行业智能音箱研究报告2018年3月出版内容目录一、核心投资逻辑5(一)行业投资逻辑:需求、技术、产品条件均驱成熟5(二)投资建议:供应链中短期看好,技术品牌长期布局5二、现状:智能音箱迎风口,产业巨头忙逐鹿7(一)海外市场巨头抢滩布局,亚马逊强势领跑71、亚马逊 Echo:产业先行探索成就先发优势82、谷歌 Google Home:优秀算法厂商的探索之路103、苹果 HomePod:音质突出,生态并进,“硬件+环境”厂商不甘人后104、Invoke:软硬件巨头的天作之合11(二)国内市场方兴未艾,本土优势迎发展机遇111、京东叮咚132、天猫精灵 X1143、小米 AI 音

2、箱14三、前承交互入口革新之便,后启人工智能落地之利16(一)技术角度看智能音箱:语义理解是瓶颈16(二)技术升级:人工智能产业落地,语义理解加速提升20(三)场景升级:承载物联网新交互入口21四、语音生态延伸应用,智能音箱成长潜力可观24(一)智能音箱市场高速发展,2021 年全球预计出货 1 亿台24(二)家居、车载将是重要场景,智能音箱市场潜力巨大241、家庭依然是智能音箱的首要市场空间242、高端酒店市场成为智能音箱的拓展领地273、远场语音交互在车载市场大有可为29五、智能音箱产业链拆解及推荐标的31(一)智能音箱产业链分析311、智能音箱结构拆解312、软硬件技术国内企业均有涉足3

3、2(二)核心投资标的推荐331、歌尔股份(002241)332、全志科技(300458)34六、风险提示35图表目录图 1:全球智能音箱产品发布时间线7图 2:亚马逊 Echo 智能音箱发展8图 3:Alexa 平台技能数量快速增长(2015.9-2017.9)9图 4:Alexa 平台技能分类9图 5:Echo 智能音箱通过 Alexa 平台控制家庭环境内的其他智能产品9图 6:Google Home 系列产品10图 7:Google Home 支持的服务10图 8:苹果 HomePod 在智能家居的应用10图 9:苹果 HomePod 内部构造10图 10:微软智能音箱 Invoke11图

4、 11:Invoke 构成图11图 12:国内智能音箱市场零售量快速增长(2016.01 2017.08)12图 13:国内智能音箱市场价格段分析(2016.01 2017.08)12图 14:京东叮咚智能音箱发展13图 15:阿里智能音箱天猫精灵 X114图 16:天猫精灵 X1 功能14图 17:小米智能音箱14图 18:小米智能音箱在家庭场景中的应用14图 19:小米智能音箱使用场景15图 20:小米智能音箱技能举例15图 21:小米 AI 音箱目前可控制的智能设备15图 22:小米智能家居产品举例15图 23:智能语音交互过程16图 24:家庭复杂的声音环境17图 25:麦克风阵列解决

5、远场语音拾音难点17图 26:Amazon Echo 6+1 麦克风阵列17图 27:远场拾音和近场拾音17图 28:语言识别过程18图 29:语音识别正确率18图 30:以英语为代表的语音合成过程19图 31:全球声纹识别收入情况(2016 20201E)19图 32:全球声纹识别市场规模分布(2016 20201E)19图 33:2017 年人工智能技术成熟度曲线20图 34:语音识别准确率不断提高20图 35:语音设备的核心价值和核心场景21图 36:人机交互的演进历程21图 37:家电智能化的演进历程23图 38:全球智能音箱出货量(2014 2022E)24图 39:全球智能音箱市场

6、规模(2014 2022E)24图 40:全球家电市场规模及增长率(2015 2020E)25图 41:全球智能家电市场规模及增长率(2015 2020E)25图 42:全球智能家居互联市场(2016 2021E)25图 43:全球智能家庭数(2016 2021E)25图 44:美国智能家居市场(2015 2022E)25图 45:中国智能家居市场(2015 2022E)25图 46:智能音箱进入杭州西轩酒店智能客房27图 47:智能门锁27图 48:2016 年中国客房数结构28图 49:2016 年美国客房数结构28图 50:采用思必驰语音方案的智能后视镜29图 51:驾驶场景下智能后视镜

7、的使用29图 52:Google Home 所有零部件拆解31图 53:Echo 所有零部件拆解31图 54:智能音箱产业链33表 1:推荐标的估值汇总6表 2:海外市场主流智能音箱产品出货对比(单位:百万台)7表 3:国外 4 大智能音箱对比8表 4:国外智能音箱厂商难以进入中国的原因12表 5:国内市场智能音箱产品13表 6:智能音箱 v.s. Wifi 音箱 v.s.蓝牙音箱16表 7:语音与触摸作为输入方式的对比:22表 8:2021 年家庭场景下智能音箱保有量测算26表 9:2021 年中国视力残疾市场的智能音箱保有量测算27表 10:智能酒店改装股本估算28表 11:2021 年智

8、能音箱在酒店市场的空间测算29表 12:未来五年智能后视镜后装市场出货量及渗透率测算30表 13:Amazon Echo 拆解32表 14:Google Home 拆解32一、核心投资逻辑智能音箱作为消费电子市场的新产品,从亚马逊在 2014 年低调推出以来,持续收获理想的 市场认可度和关注度,无论是海外市场还是国内市场的主要终端产品商、互联网厂商、软件公司、 创业企业纷纷加入了产业的布局,努力将智能音箱打造成为智能手机之后必备的单品。作为消费 电子产业具有引导意义的 CES 展会上,智能音箱相关产业也获得了来自芯片到终端厂商额青睐。 我们认为,从消费需求、产品技术以及品牌建设方面看,智能音箱

9、作为新品有望迎来产业快速成 长期。(一)行业投资逻辑:需求、技术、产品条件均驱成熟市场需求是产业发展的根本动力,核心逻辑是语音交互将会成为入口:我们认为语音交互凭 借其在便捷性、安全性、符合人们生活习惯等特质,有望成为在智能化生活中取代或者结合图形 界面成为人机交互入口选择,其市场需求来源于预计将会有三个主要方面:1)智慧家居入口是 智能音箱需求的核心动力;2)以高端酒店为代表的商业地产也会是智能音箱的潜在需求领域;3) 以语音控制的智能后视镜为代表的车载泛智能语音产品也是产业市场发展的重要方向。人工智能助力语音处理能力,语义识别期待加速:要实现在上述场景中的有效应用,智能音 箱的核心对于音频

10、信号的处理,整个过程包含了 7 个步骤,其中语音识别和语义理解是核心的技 术,随着人工智能技术应用显著提升大数据处理能力,无论是依赖云端服务还是在终端处理,未 来智能音箱的音频处理能力将会有显著提升,其作为交互入口的定位又会成为重要的数据来源, 进而形成有效的正向反馈,使得智能音箱类产品成为了各大厂商争相推动的产品。各大厂商纷纷入局,产品市场群雄逐鹿:为了能够在智能化场景入口中占据重要位置,亚马 逊低调发布智能音箱 Echo 后的超预期反响催生了市场热情,谷歌、苹果、微软等全球的一线互 联网、智能终端厂商等纷纷跟进。同样,国内厂商的嗅觉也异常敏锐,京东、阿里、小米等巨头 和各类创业型企业也不断

11、发布相关的产品,尤其是在人工智能技术的渗透影响下,音频处理如虎 添翼,行业从导入期有望过渡到成长期的前期,迎来广阔的发展空间。(二)投资建议:供应链中短期看好,技术品牌长期布局从目前产业链的格局看,作为新产品,国内企业在产业链的各个环节布局较为完善,硬件领 域从核心芯片、各类原件、加工组装方面均深度涉足,因此对于行业出货量预期将会从导入期向 成长期推进的过程中,中短期我们看好元器件及组件供应商,重点推荐关注声学部件供应商歌尔 股份(002241)和芯片供应商全志科技(300458),建议关注北京君正(300223)、奋达科技(002681)、 国光电器(002045)等。中长期看,随着语音作为

12、日程生活助理的入口将会持续渗透,不管产品 形态将会以何种形式出现,因此能够在语音识别、处理、应用方面拥有竞争力的公司将会具备长 期发展空间,因此建议关注中文语音识别市场的龙头企业科大讯飞(002230)等标的。表 1:推荐标的估值汇总股价市值EPSPE代码名称元亿元20162017E2018E20172018PB002241.SZ歌尔股份15.144910.540.680.9522163.28300458.SZ全志科技*22.21740.540.510.5044443.65300223.SZ北京君正*28.42470.780.150.261921114.22002045.SZ国光电器*13.2

13、8550.190.340.7639173.84002681.SZ奋达科技*10.451550.180.370.5529192.51002230.SZ科大讯飞*57.628000.280.370.5115711310.31资料来源:Wind,(截至 2018 年 3 月 7 日收盘价,*采用 Wind 市场一致预期平均值)二、现状:智能音箱迎风口,产业巨头忙逐鹿自 2014 年亚马逊 Echo 横空出世,智能音箱开始进入人们视野,包括亚马逊在内都不甚看好 的产品却快速成为市场主流,随之而来的大量科技企业前仆后继。争相进入这个新兴市场,努力 将智能音箱包装成智能手机之后的新一代“必买”产品。图 1

14、:全球智能音箱产品发布时间线资料来源:智东西,国内厂商方面,尽管之前都有产品发布,但是在 2018 年 CES 上,百度、阿里、京东等龙头 企业不约而同的针对智能音箱都有新的技术和产品发布,市场竞争日趋激烈。近期,苹果正式开 启了 HomePod 的预定和发售,也引起了消费市场的持续关注。(一)海外市场巨头抢滩布局,亚马逊强势领跑海外智能音箱市场已经被消费市场有效接受,美国国家公共广播电台(NPR)和爱迪生研究 公司(Edison Research)联合发布的调查报告显示目前美国智能音箱用户约 3,900 万,智能音箱 普及率高达 16%,可以看到智能音箱已经覆盖近六分之一的美国人口,并已成为

15、美国家庭生活不 可或缺的一部份,调查中有 65%受访用户反应不想回到没有智能音箱的生活。从 2017 年 Q3 最 新的出货量来看,整个智能音箱市场持续保持高增速,2017 年全年出货量有望突破 3,000 万台; 从区域和市场来看,北美为当前全球最大智能音箱市场,三季度市占率达约 75。表 2:海外市场主流智能音箱产品出货对比(单位:百万台)厂商17Q3 出货量17Q3 市场份额16Q3 出货量16Q3 市场份额同比增长率亚马逊5.066.9%0.993.5%478%Google1.925.3%0.00.0%京东0.11.6%0.00.0%小米0.11.3%0.00.0%阿里巴巴0.10.9

16、%0.00.0%其他0.33.9%0.16.5%383%合计7.4100%0.9100%708%资料来源:Strategy Analytics,从产品来看,海外典型智能音箱产品以软件互联网巨头发布为主导,包括亚马逊的 Echo 系 列、Google 的 Home、苹果的 HomePod 以及微软的 Invoke;四组产品均搭载独立研发的语音助 手,产品间功能相差不大,但各有优势。表 3:国外 4 大智能音箱对比项目EchoGoogle HomeHomePodInvoke制造厂商Amazon谷歌苹果微软和三星主控芯片TIMarvell(美满)苹果/价格$179.99$129$349$199麦克风

17、阵列方案6、7 个麦克风环形阵列双麦克风线性阵列6 麦克风阵列7 麦克风环形阵列语音助手AlexaGoogle AssistantsiriCortana技能数1 万个1000 个/智能家居平台云平台 AWS/HomeKit/市场优势先行者、市场语音交互HomeKit 和高音质硬件生态资料来源:亚马逊官网、苹果官网,搜狐科技,亚马逊,Google 的智能音箱产品合计占据了全球 90%以上的市场,两者的发展可以说是代 表了智能音箱市场发展的两种典型模式:亚马逊依靠多年构建平台的生态协同,通过尽量多的场 景增加用户黏性;Google 借助其智能助手以及搭载其系统的智能硬件,通过海量的设备扩散, 采集

18、数据,使 AI 不断迭代进化。1、亚马逊 Echo:产业先行探索成就先发优势亚马逊 2011 年就开始在实验室进行智能音箱研发,2014 年 11 月推出首款智能音箱 Echo, 除播放音乐外也是家庭设备(兼容 Nest/IFTTT 等产品)控制枢纽,可连接第三方服务(如叫车, 定外卖等),系列产品至今各型号已累计销售破千万台,分析其发展主要有两点:1)不断丰富家族产品。2017 年 9 月,亚马逊推出了 6 款围绕 Alexa 的新品,包括 5 款 Echo 系列新品第二代 Echo、Echo Plus、Echo Spot、Echo Connect,Echo buttons;在降低价格的 同

19、时,新品针对每个家庭,每个人,每个房间的每一个差异化的需求提供全方位服务。其中的 Echo Spot 可以作算作 Echo Show 的升级版,是亚马逊又一传统品类升级的新尝试,选取了用户 需求量较大的传统品类闹钟作为切入点,开拓语音、图像融合的新人机交互模式。图 2:亚马逊 Echo 智能音箱发展资料来源:GFK 报告,2)搭建生态,深挖服务需求。Alexa 平台是随 Echo 一起在 2014 年问世,作为 Echo 产品的 核心技术,是一个基于云端计算的服务体系,通过云端以及机器学习,取代使用程序繁琐的 APP 解决用户的各类问题,包括购物、家电控制、播放音乐、新闻、设置闹钟等。自 20

20、15 年第三方 开发平台开放以来,Alexa 的技能数快速增长,2017 年 9 月已经突破 20,000 项大关。从技能分 类来看,排名最靠前的五类技能分别是:新闻、游戏/杂物/附件、教育/参考、生活方式、小说/ 笑话。图 3:Alexa 平台技能数量快速增长(2015.9-2017.9)图 4:Alexa 平台技能分类资料来源:Alexa 网站,Bi intelligence,资料来源:Voice Labs,智能家居领域是 Alexa 平台的重要布局,目前已经有 LG 的冰箱、GE 的灯具、海信 4K 电视 等内置 Alexa 的电子产品,随着主流家居设备逐步接入,不断扩大的用户群将会持续

21、带来流量红 利。Echo 产品最初让人眼前一亮的就是可以通过 Alexa 平台控制家庭环境内的其他智能产品, 比如通过指令使 Alexa 开灯或关灯。图 5:Echo 智能音箱通过 Alexa 平台控制家庭环境内的其他智能产品资料来源:亚马逊网站,亚马逊定义了一套家居互联协议,使得 Echo 拥有更大的话语权要求其他的家居产品搭载 Alexa 智能语音交互平台,对于家电的控制,使得亚马逊有资本将语音交互做大做强;不仅于此, 亚马逊还为用户提供了通过智能音箱语音下达购物指令的频繁场景,不断地为帮助用户养成新的 交互习惯和提升黏性添砖加瓦;可以说 Echo 的成功是恰到好处的先发优势+场景的胜利。

22、2、谷歌 Google Home:优秀算法厂商的探索之路谷歌在 2016 年 5 月 19 日的 Google I/O 发布会上,推出了一款硬件产品:类似亚马逊 Echo 的 语音助理设备 Google Home;在 2017 年的谷歌秋季新品发布会上,新增推出了两款换代产品: Home Mini 和 Home Max,售价分别为 49 美元和 399 美元。图 6:Google Home 系列产品图 7:Google Home 支持的服务资料来源:搜狐科技,资料来源:雷锋网,谷歌的优势在于以成熟的云计算优势让硬件配置不高的 Google Home 能够胜任语音识别的 应用,而谷歌音箱是根据它

23、在房间所处的位置自己调整声音。在功能上,Google Home 可以成为 家庭设备的控制中心,注重于音乐娱乐和语音搜索。例如通过语音控制音响,连接到灯光、恒温 器等设备。具体来说,它能帮助用户设置任务清单、购物清单、闹钟等等,甚至可以通过它来预 定车辆(比如 Uber)。目前谷歌音箱能搭配超过 1,000 种智能产品协同工作,但与亚马逊 Echo 不同的是,谷歌还没有将 Home 平台开放给第三方开发者。3、苹果 HomePod:音质突出,生态并进,“硬件+环境”厂商不甘人后苹果在 2017 年 6 月 5 日发布了智能音箱 HomePod,价格为 349 美元。HomePod 是一个 7 英

24、 寸稿的圆形音箱,采用了苹果自家的 A8 处理芯片,内部集成了 7 组定向喇叭,能够智能感知周 围环境,并根据相应的空间探测来调整发出的声音。图 8:苹果 HomePod 在智能家居的应用图 9:苹果 HomePod 内部构造资料来源:苹果官网,资料来源:苹果官网,HomePod 在外观上有太空灰和白色两个版本,HomePod 实际上并不是一款对标亚马逊 Echo、 谷歌 Home 的智能音箱产品,虽然 HomePod 也是一个智能入口,能够集成广播、天气、提醒、通知等功能,还能连接和控制家中的智能家居设备,但是 HomePod 更多关注音乐音质的, HomePod 内部整合了 Apple M

25、usic,用户可以通过 Siri 来发出相关的指令(比如让音箱放歌),音 箱就能够通过 Siri 来识别和收集用户的偏好,并根据用户的兴趣来调整和推荐音乐。而且 HomePod 非常容易连接 iphone 等设备,只要将苹果手机靠近 HomePod 智能音箱,那么几秒钟后 两个设备就会自动通过感知而相互连接。4、Invoke:软硬件巨头的天作之合微软与三星合作的新品 Invoke,是由三星电子的 Harman Kardon 子公司制造,使用微软的 Cortana 语音助手来处理指令。同时借助了微软的语音识别技术来实现命令和音乐控制,集成的 Office365 生产力服务可以帮你安排管理事务、检

26、查日历、设置闹钟等。用户还可以尝试其它智 能家居功能,如语音控制开灯等。Harman 强调这款设备集成了微软的 Skype 互联网电话服务。 Invoke 售价 199 美元,将提供石墨黑以及珍珠白两种颜色。图 10:微软智能音箱 Invoke图 11:Invoke 构成图资料来源:IT 资讯,资料来源:IT 资讯,Invoke 配备了 3 个有向型低音、3 个定向高音、以及 2 个被动式音频单元,内置的 7 个麦克 风还支持哈曼都独有的“远场”语音识别技术。Invoke 在音质上颇费了一番功夫,采用 360环 绕式音响设置、三个高音扬声器和 Dalek 式设计。除了 Cortana,Invo

27、ke 还支持 Spotity Premium、 iHeart Radio、Tuneln、Pandora 等服务的语音控制。(二)国内市场方兴未艾,本土优势迎发展机遇Echo 产品的持续火爆也点燃了国内市场,国内的智能音箱的产品越来越多,叮咚音箱、天 猫精灵 X1、小米 AI 音箱等;从市场整体来看,还处于一个培养用户使用习惯的增量阶段。GFK 数据显示,自京东 2015 年 5 月率先推出首款叮咚 A1 抢占智能音箱国内市场后,整体智能音箱 零售量一直呈稳定增长;随着 2017 年下半年几大厂家新品的陆续推出,零售量有了明显的飞跃,8 月份月零售量已接近 3 万台,伴随双十一的促销热潮,预计全

28、年累计零售量将达到 35 万台;同时我们看到国内智能音箱产品市场价格逐渐走高,低价产品占比降低,300-600 元逐渐成为主 流价格段。图 12:国内智能音箱市场零售量快速增长(2016.01 2017.08)图 13:国内智能音箱市场价格段分析(2016.01 2017.08)资料来源:GFK 报告,资料来源:GFK 报告,虽然国外市场各巨头发展迅速,但是国内市场仍然以天猫、京东等国内厂商为主,这是由技 术、使用场景和资源拥有权所决定的。类似于搜索市场,就像谷歌难以做好中文搜索一样,中文 语音识别方面,以科大讯飞为国内技术公司更有本土优势。此外,国内厂商更了解本土用户使用 智能音箱的习惯,能

29、够满足消费者的使用要求。另外在资源整合方面,音乐、有声读物等内容被 国内厂商所掌握,电商、快递、地图信息、百科知识等各种技能资源掌握在国内服务商手中。表 4:国外智能音箱厂商难以进入中国的原因国外厂商国内厂商中文语音识别技术不占优占优对中国用户的使用场景的把握不占优占优音乐、有声读物等各种内容资源不占优占优地图信息、百科知识等各种技能资源不占优占优资料来源:2017 年美国智能音箱覆盖率已经达到近六分之一,国内市场虽然起步,但是还没有迎来想 象中的蓝海市场。对比中美智能音箱市场,我们分析有以下几点:1)使用场景方面。西方国家消费者使用开放式的厨房与客厅,而国内的厨房烹饪环境嘈杂、 油烟重,厨房

30、客厅相对封闭,家庭使用音箱频次并不高。国内尚未建立完全的智能家居生态体系, 使用场景碎片化、硬件操作复杂等问题为解决,消费者无法体会智能家居的智慧和便捷;2)语音技术方面。国内的智能音箱语音技术比 Echo 要难得多,Echo 是全英文识别,而汉 语本身要难的多,方言、语速、说话习惯等问题,并且国内受众对英文歌曲的喜好,导致对中、 英文混合识别技术也有要求;3)行业标准方面。国内的智能语音交互的平台并没有成熟和完善,智能家居缺乏配套法规 和统一标准,产品良莠不齐,消费者体验较差;4)产品内容方面。国内的内容/应用厂商分散,如三大音乐集团 QQ 音乐、海洋音乐和阿里 音乐带来国内的音乐版权分裂而

31、不互通;O2O 点餐领域的美团、饿了么信息不互通;造成智能 音箱的使用不便。表 5:国内市场智能音箱产品公司产品发布时间卖点售价(元)自定义唤醒词/拨打电话/屏幕语音双交互亲见H1 智能音箱2016.5/1980酷狗酷狗潘多拉2016.11/1990RokidPebble2016.11独特外型/多轮对话技术1399联想Smart Assistant2017.1899多轮深度对话Tic home2017.4Tic watch/ Tic mirror/多方互联649小鱼在家,百度分身鱼*2017.4/3299喜马拉雅小雅音箱2017.6喜马拉雅 FM 海量音频999问之科技麦宝2017.6/阿里巴

32、巴天猫 X12017.7“声纹支付”购物方便499小米小爱音箱2017.7控制小米生态链产品299百度raven H2017.11/1699DOSS,百度DOSS 小度智能音箱2017.11/399腾讯小 Q 机器人二代*2017.12/2680京东、科大讯飞叮咚音箱2015.5798出门问问资料来源:GFK,亿欧,从目前国内智能音箱布局厂商看,可以分为五类:1)互联网公司:拥有庞大的业务布局, 希望建立以语音为入口的智能生态,为既有的内容和服务寻找新的入口。如 BAT、京东、小米; 2)技术厂商:依托语音技术方面的积累,专注于做技术开放平台或提供语音技术方案。如科大 讯飞、思必驰、出门问问;

33、3)内容厂商:占有独特的 IP 资源,倾向于将智能音箱打造成音乐、 有声读物等流媒体内容载体。如喜马拉雅、酷狗;4)创业公司:多关注与具体应用场景的结合, 如主打智能家居的 Rokid;5)传统音箱厂家:在传统音箱硬件研发上已有积淀,倾向于与技术 及内容厂商合作。如漫步者、Doss。1、京东叮咚京东与科大讯飞合作的智能音箱叮咚在 2014 年 11 月发布,主要针对中国市场,该设备可以 理解普通话,粤语和基本英语。图 14:京东叮咚智能音箱发展资料来源:GFK 报告,叮咚音箱主要用于播放音乐,设置闹钟,在线购物,并获得天气报告等。分析来看,叮咚音 箱整体产品线与 Echo 最像,发展遵循着抢占

34、入口、布局智能生态布局、定位本土化三方面布局; 从 2015 年 5 月的 A1 开始,至今已经发售了一系列新品。本土化方面,叮咚的横向设计更符合 中国消费者习惯,A1X 儿童口语机器人拓展应用到儿童早教市场。2、天猫精灵 X1天猫精灵 X1 是阿里人工智能实验室在 2017 年 7 月 5 日发布,有黑白两色款;在硬件配置 方面,采用 360 度全向 5 米拾音麦克风矩阵。定制业内第一颗 Smart Audio 专属优化芯片,可使 面积减小 25%,功耗降低 32%,效率提升 25%,在解码、降噪、声音处理和多声道协同方面进 行了针对性的优化处理。图 15:阿里智能音箱天猫精灵 X1图 16

35、:天猫精灵 X1 功能资料来源:天猫官网,资料来源:天猫官网,在功能方面,天猫精灵 X1 内置阿里第一代中文人机交流系统 AliGenie,除自然语言理解外, 引入了“决策引擎” 机制,能够理解上下文语境,支持多轮对话。目前可实现智能家居语音购 物、手机充值、叫外卖、音频音乐播放等功能。此外,采用声纹识别系统,同一款设备最多识别 6 人的声音,针对不同声音判断不同内容进行回答,用户还可通过自己的声音完成购物支付验证 环节。通过声纹识别,有针对性的语音助手和网上购物的安全性大大增加了天猫精灵的使用场景。3、小米 AI 音箱小米 AI 音箱是小米公司在 2017 年 7 月 26 日发布的一款智能

36、音箱,是由小米电视、小米大 脑、小米探索实验室联合开发。小米把“小爱同学”作为 AI 音箱的唤醒词。图 17:小米智能音箱图 18:小米智能音箱在家庭场景中的应用资料来源:小米官网,资料来源:小米官网,小米 AI 音箱采用长方柱形设计,搭配 1600 万种颜色的彩色环,被动扬声器加上 360声场, 号称任何角度都好听;音箱内置 6 个数字麦克风,可 360 度收音,支持远场语音操控功能。小米 AI 音箱支持人工智能回复用户指令,支持在线音乐、小说相声、儿童故事、广播电台等海量互 联网内容,还支持天气查询、路况查询、亲戚称呼查询、查找手机等功能。图 19:小米智能音箱使用场景图 20:小米智能音

37、箱技能举例资料来源:小米官网,资料来源:小米官网,近几年小米在国内智能家居中布局相对完善,米家依附与小米生态链,汇聚了几十家生态链 公司最为用心的产品,是如今国内体验较好的智能家居生态之一。图 21:小米 AI 音箱目前可控制的智能设备图 22:小米智能家居产品举例资料来源:小米官网,资料来源:小米官网,智能家居的产品也拓展了十几个品类之多,联动各种智能开关和万能遥控,包括小米 AI 音 箱还可以控制扫地机器人、空调、空气净化器、电视、电风扇、智能灯、盒子、电饭煲八大类设 备。三、前承交互入口革新之便,后启人工智能落地之利对比传统音箱,智能音箱不仅是音响产品,同时是涵盖了内容服务、互联网服务及

38、语音交互 功能的智能化产品,不仅具备 WiFi 连接功能,提供音乐、有声读物等内容服务及信息查询、网 购等互联网服务,还能与智能家居连接,实现场景化智能家居控制。表 6:智能音箱 v.s. Wifi 音箱 v.s.蓝牙音箱智能音箱Wifi 音箱蓝牙音箱运行方式独立运行辅助手机等电子产品运行辅助手机等电子产品运行成本一般比 WiFi 音箱稍高高低传输方式一对多一对多点对点可控制家居可以不可以不可以学习能力可通过云端学习可通过云端学习无语音助手有无无开放接口有无无资料来源:从技术本质来看,智能音箱是语音交互的一个落点;从硬件形态来看,智能音箱是音箱的进 化;从功能/场景来看,智能音箱的卖点在于内容

39、和互联网服务。(一)技术角度看智能音箱:语义理解是瓶颈智能音箱在使用过程中,主要包括 7 个过程。第一步通过麦克风矩阵远距离拾取声音,第二 步特定的声音指令激活智能音箱,之后上传云端进入下一步,第三步将输入的语音转为文字的过 程,即语音识别,第四步理解了用户输入的语义之后输入对话管理模块中,即自然语言理解,第 五步协调各个模块的调用以及维护当前对话状态,并将特定的回复方式交由自然语言生成模块进 行处理,即对话管理。第六步生成特定回复文本,即自然语言合成。第七步将文字转变为语音并 通过喇叭输出,即语音合成。图 23:智能语音交互过程资料来源:雷锋网,接下来我们会对语音交互中的语音识别、语音合成、

40、语音理解部分进行简单的介绍,并且随 着安全性的需求持续增加,在智能音箱的使用过程中声纹识别技术被用于进行安全性的比对。麦克风阵列拾音: 如图所示,由于家庭环境中声源距离可能较远,并且存在噪声、多径反射和混响等复杂的声音环境,我们可以采用麦克风阵列来解决上述问题。图 24:家庭复杂的声音环境图 25:麦克风阵列解决远场语音拾音难点资料来源:雷锋网,资料来源:搜狐,麦克风阵列是声学传声器阵列中的一个狭义概念,特指应用于语音处理按一定规则排列多个 麦克风组合。麦克风能灵活布局,采用线性阵列、平面阵列、立体阵列三种方式,能适应各种远 距离应用场合,识别整个房间内各个位置的声音,保证准确稳定对采集的不同

41、空间方向的声音信 号进行空时处理,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等 功能,以提高真实环境下的语音识别率。Amazon Echo 采用的是环形 6+1 麦克风阵列,能迅速 360全方位识别实现环形拾音,准确进行声源定位,并能够有效地在家居环境下进行抗噪处理。图 26:Amazon Echo 6+1 麦克风阵列图 27:远场拾音和近场拾音资料来源:雷锋网,资料来源:雷锋网,与以手机为代表的近场语音拾取技术不同,近场语音拾取通过按住麦克风,在声源接近的情 况下获得语音信号,这种声源信号的噪声低且基本无混响。单在家庭应用环境中,需要通过麦克 风阵列拾音可以解决降噪和

42、去混响的问题,智能音箱就显得必要。使用唤醒词唤醒智能音箱:唤醒智能音箱一般包括两个步骤,即语音激活检测(VAD)和语音唤醒(VT)。语音激活检测 (VAD)指的是通过算法判断什么时候有语音,并将有效语音片段截取出来之后再处理,这样可以 极大减少计算量。在使用 VAD 截取出来有效语音片段之后,那么涉及语音唤醒(VT)技术。VT 技术是智能硬件在休眠状态下通过个性化唤醒词被唤醒,比如亚马逊 Echo 音箱的唤醒词为“Echo” 或“Alexa”,当判断到用户说了激活词之后,智能音箱将会继续进行后续的语音识别并处理,否 则对后续的语音不进行处理,一般而言 VT 基本是在本地设备上处理,不会用到云端

43、计算。语音识别技术: 语音技术即是将用户输入的语音转化为文字的技术。一个完整的语音识别大致分为两个步骤:首先是在语音输入之后的语音特征提取,其目的是从语音波形中提取出随时间变化的语音特征序 列。然后是声学模型与模式匹配过程,过程中将输入语音的特征矢量依次与训练阶段简历的模板 库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。图 28:语言识别过程图 29:语音识别正确率资料来源:百度百科,资料来源:易观智库,从目前的识别率来看,语音识别的识别率已经大大提升,google 等厂商从 2010 年不到 70% 的正确率提升到 90%,谷歌和 IBM 为例也能够实现安静环境下 95%以上

44、的识别率,基本与人类 速记员(约 94%)的正确率相当,而国内厂商百度和搜狗等已经能够实现安静环境下 97%以上 正确率。目前语音识别技术相对成熟,随着机器学习和深度学习的发展,人机语音交互的准确率 即将突破量变到质变的临界点(99%)。自然语言理解:自然语言理解是指人工智能的分支学科。自然语言理解研究用电子计算机模拟人的语言交际 过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通 信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自 然语言信息的加工处理。自然语言理解目前尚处于浅层语义分析阶段, 大致包含词法分析、句 法分析、语义分析这三个既递进又相互包含的层面。 目前机器对句子的理解还只能做到语义角 色标注层面,即标出句中的句子成分和主被动关系等,属于浅层语义分析技术。自然语言理解技 术发展相对不成熟,仍需完善。语音合成技术:语音合成,又称文语转换(Text to Speech)技术,涉及声学、语言学、数字信号处理、计算 机科学等多个学科技术,将任意文字信息实时转化为标准流畅的语音朗读出来。与传统的声音回放设备(系统)如磁带录音

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号