《硕士论文中国移动基于语音识别的情感分析系统的设计与实现.doc》由会员分享,可在线阅读,更多相关《硕士论文中国移动基于语音识别的情感分析系统的设计与实现.doc(64页珍藏版)》请在三一办公上搜索。
1、密级: 保密期限: 硕士学位论文 题目:中国移动基于语音识别的 情感分析系统的设计与实现 学 号: 姓 名: 专 业: 软件工程 导 师: 学 院: 软件学院 年 月 日独创性(或创新性)声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名: 日期: 关于论文使用授
2、权的说明本人完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。本学位论文不属于保密范围,适用本授权书。本人签名: 日期: 导师签名: 日期: 中国移动基于语音识别的情感分析系统的设计与实现摘 要伴随着科学技术的飞速发展和人们对计算机依赖性的不断增加,如何使计算机对气氛和环境等因素具有更强的感知能力,从而分析说话人的情感和态度,将成为计算机语音情感识别技术发
3、展的新目标。语音的情感分析是一个新兴的课题,对它的研究是进一步发展人机交互技术的基础,虽然已经取得了一些进展,但是还有很多问题值得更加深入的研究。本文根据实际工作需要,设计并实现了中国移动基于语音识别的情感分析系统。论文应用Matlab语言完成对语音情感的分析,采用J2EE中的Spring和Hibernate完成对人员设置功能的实现,采用Mel频率倒谱系数MFCC和动态时间规整DTW算法,对系统中话务员、移动客户、公司考评领导和系统管理员四种用户进行了分析,并详细分析了系统管理功能、数据来源功能、情感分析结果管理功能以及信息反馈功能。根据分析结果,设计并实现了一个中国移动基于语音识别的情感分析
4、系统,并对系统管理模块、数据来源模块、情感分析结果管理模块以及信息反馈模块的设计和实现过程进行详细的论述,系统的数据存储使用Oracle数据库来实现,所以对数据库关系的设计进行了论述,并列举部分数据表的详细设计。客户服务中心的优质服务是中国移动与客户进行沟通的重要桥梁,语音情感识别在未来将会被广泛应用,中国移动基于语音识别的情感分析系统的完成,对中国移动话务员的服务质量提供了有力的评证,可以根据分析的数据对话务员的服务态度进行评价,保证通话质量,提高客户满意度。关键词:Matlab;J2EE;语音情感;动态时间规整算法The Design and Implementation of China
5、 Mobile Sentiment Analysis System Based on Speech RecognitionABSTRACTWith the rapid development of science and technology and peoples stonger dependence on the computer, it will become a new goal for the speech recognition technology to make the computer more competent in sensing the climate and env
6、ironmental factors so as to better analyze the speakers emotions and attitudes. Sentiment analysis of the speech is an emerging issue, and its research is the basis for the further development of human-computer interaction technologies. Research on sentiment analysis of the speech has made some prog
7、ress in many areas, but as for the real human interaction technology, there are still many problems to be solved. Based on the actual work needs, we design and implement a sentiment analysis aystem of China Mobile based on speech recognition. We apply Matlab in making sentiment analysis of the speec
8、h; use Spring and Hibernate in J2EE in realizing of the function of personnel setting; use Mel Frequency Cepstral (MFCC) and dynamic time warping (DTW) algorithms in analyzing the four users of system operators, mobile customers, evaluation managers of the company, and system administrators; and ana
9、lyze in detail the functions of system management, data sources, sentiment analysis results, and information feedback. According to the analysis results, a China Mobile sentiment analysis system based on speech recognition is designed and implemented, and the design and implementation processes of s
10、ystem management module, data sources module, sentiment analysis results management module, and information feedback module are discussed in detail. The data storage of the system use Oracle database, so the design of the database relations is discussed, and detailed designs of some data tables are
11、cited.The quality service of the customer service center is an important bridge of communication between China Mobile and its customers, and speech sentiment recognition technology will be widely used in this field in the future. The sentiment analysis system of China Mobile based on speech recognit
12、ion will provide a powerful tool for China Mobile in assessing the quality of service of their operators, so as to ensure the call quality and improve customer satisfaction.KEY WORDS:Matlab; J2EE;Speech Emotion, Dynamic Time Warping Algorithm目 录第一章 引言111 课题背景112 课题任务2121 课题内容2122 本人承担任务213 论文结构2第二章
13、相关技术介绍421 Matlab语言介绍422 J2EE介绍523 JSP介绍624 数据库介绍725 模式设计介绍926 本章小结9第三章 系统需求分析1031 系统总体需求分析1032 系统功能分析12321 系统管理功能分析12322 数据来源功能分析13323 情感分析结果管理功能分析18334 信息反馈功能需求分析1934 本章小结21第四章 系统设计2241 系统架构设计2242 各模块设计23421 系统管理模块的设计23422 数据来源模块的设计27423 情感分析结果管理模块的设计31434 信息反馈模块的设计3143 数据库设计33431 数据库关系结构图33432 基本表
14、的设计34433 关系表的设计3744 本章小结37第五章 系统实现3851 系统总体实现3852 其他功能模块的实现39521 系统管理模块的实现39522 数据来源模块的实现43523 情感分析结果管理模块及信息反馈模块的实现4753 本章小结48第六章 系统测试4961 功能测试49611 界面的设计49612 GUI测试界面的操作50613 测试方法51614 测试结果5162 本章小结52第七章 结束语5471 论文工作总结5472 问题和展望54第一章 引言11 课题背景中国移动的10086客服系统以及投诉管理系统(例如投诉及回访)都会有人工服务,即电话服务,这些电话会被录音,但录
15、音信息不能像文字信息一样便于查找和分析,所以系统将通过语音识别来记录一些对话中的关键词,然后再进行分析看客户致电时的情绪如何,从而智能的判断和收集客户的满意度信息。伴随科学技术飞速的发展和人们逐渐对计算机越来越依赖,人类与计算机之间的“沟通”变得更加受科学家们的关注。为了使计算机变得更加“人性化”,减少人类与计算机之间的沟通障碍,使计算机能够感知人类说话时的态度以及情感,对研究的目的来看,使计算机变得情感智能化显得尤为重要 1。所以想让计算机更加适应人类的需要,必须先时机器能够识别人类的情感,然后根据机器识别出的情感来调整沟通的方式。人类通过听觉所得到的是语音模式信息,其中包括非符号和符号信息
16、。语音信号处理是去除掉语音中的噪声,将其中的非符号进行保留, 2。相同的一句话,因为说话人所表达的情感差异,听者的感知也会存在有很大的差异。人类通过不同的感知器官来同时接收不同形式的信息,怎样有效和快速利用不同的信息使信息传递效果达到最佳,将成为未来处理信息研究的重要发展方向。所以对语音中的情感信息通过计算机来研究是具有非常大的意义。将语音信号中的情感特征进行提取,从而来判断其中包含的情感3,这种研究不但具有科学上的意义,同时在实际应用中也具有很多价值。语音的情感分析对实现人机间的无障碍交流具有很深的意义。虽然已经取得了一些进展,但是计算机在识别人类情感方面还是有一些比较生硬的地方,因此需要进
17、行更加深入的研究 4。语音情感识别的难点如下:(1)语音情感数据库:必须建立一个能够充分表达情感,并且能够准确描述情感的情感语音库,将其中情感特征准确地提取出来,对于以后在情感特征上的识别研究显得尤为重要。(2)语音情感的识别:目前虽然已经有了很多的语音识别系统,但是识别的是其中的语言文字识别,并没有包含情感信息,所以语音处理中对于情感的识别研究变得很热门 5。从目前的发展水平来看,针对说话人与文字有关、说话人与文字不相关、说话人无关文字有关、说话人无关文字不相关四种训练和测试样本的组织方式进行研究。其中针对说话人与有关文字有关的研究最为成熟,而针对说话人不相关文字不相关的语音情感识别系统则成
18、为研究的重点和难点。12 课题任务121 课题内容本系统主要以中国移动对语音识别的情感分析系统的设计与实现,研究了系统中对语音情感识别算法的实现,系统将分析实现以下内容:(1)系统管理模块:包括人员设置和考核指标设置等功能,人员设置包括对管理人员的设置和被考核人员的设置;考核指标设置是指对被考核人员的考核成绩指标进行设置。(2)数据处理模块:包括语音输入,语音信号预处理,模板库建立,算法分析和结果输出等功能,这部分是对通过语音情感的特征提取与识别所分析出来的结果进行数据的保存。(3)信息反馈模块:包括邮件反馈和考核公告,邮件反馈用于将被考核的话务员的成绩以邮件的形式进行通知;考核公告是将考核成
19、绩较好或考核指标等一些相关信息以公告的形式在网站上进行公布,来方便网站使用者对信息的查看。122 本人承担任务在该中国移动基于语音识别的情感分析系统中,本人参与了系统的总体设计、数据库设计,并对系统管理模块、数据处理模块以及信息反馈模块进行了详细设计、编码、测试及文档的编写等工作。13 论文结构本文共分七章,内容安排如下:第一章 引言,介绍本课题的研究背景,研究内容,以及对语音情感识别的研究存在着哪些意义。第二章 相关技术介绍,对中国移动基于语音识别的情感分析系统的设计和实现过程中用到的开发语言、平台技术以及框架技术进行介绍,主要阐述了Matlab语言、J2EE技术平台、JSP技术以及Orac
20、le数据库的特点。介绍本系统所需要采用的设计模式。第三章 需求分析,对系统的总需求进行分析,并对系统中系统管理功能、数据来源功能、情感分析结果管理功能以及信息反馈功能进行了详细的需求分析,在数据来源功能中还对Mel频率倒谱系数MFCC和动态时间规整DTW算法进行了详细的分析。第四章 系统设计,介绍了语音识别情感分析中用到的系统架构进行设计,并对系统管理模块、数据来源模块、情感分析结果管理模块以及信息反馈模块进行详细设计,进行数据库设计,对并数据关系进行说明。第五章 系统实现,系统总体实现部分主要论述Web.xml文件配置以及数据库连接配置进行介绍,并且对系统管理模块、数据来源模块、情感分析结果
21、管理模块和信息反馈模块的实现进行详细讨论。第六章 系统测试,为了方便测试,设计并开发了基于Matlab GUI的图形用户界面完成对数据处理模块的语音情感分析部分的测试,并对测试的结果如何进行说明。第七章 结束语,对论文中所做的工作,以及系统的应用进行总结,并对系统的应用进行展望。第二章 相关技术介绍本章主要介绍中国移动基于语音识别的情感分析系统中使用到的Matlab语言、J2EE平台技术,JSP技术,以及后台用到的Oracle数据库技术。21 Matlab语言介绍MATLAB是一款商业数学软件,是一种交互式程序语言的编辑模式,主要被运用在了科学计算方面,对于算法的研究具有很好的支持,同时可以通
22、过MATLAB的GUI功能实现人机的交互,方便数据的分析6。主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等7,其图形界面接近于windows的风格,同时还对多种语言有很好的支持,因此文中可采用MATLAB进行语音信号的提取,算法在其中进行实现的解决方法,而将其他业务交由JAVA语言来进行实现。矩阵是MATLAB的基本数据单位,在开发中用到的矩阵表达式类似于在数学中用到的矩阵,用方括号将矩阵括起来,因此在解决算法等问题上MATLAB表现了其独有的优势 8。Matlab语言的优势特点包括包括以下四点:(1)强大的图形处理功能,使编程和计算结果可视化;(2)其
23、在数值计算以及符号计算上的强大功能,可以减少程序开发者在数值分析上所耗费的精力与时间。(3)强大的信号处理工具类和通信工具类,可以直接采用MATLAB提供的录音工具类,完成对语音的采集工作。(4)接近数学表达式的自然化语言和友好的用户界面,使学习者更加容易学习和掌握。MATLAB由一系列(如信号处理工具、通信工具等)工具组成。采用用户图形界面的方式,使得开发者在使用以上工具类中的函数进行开发时变得更加容易,在使用编辑和调试功能上也很方便,同时支持搜索等功能,方便用户在开发时对软件的使用。商业化的发展以及系统的升级,使得MATLAB让使用者觉得采用MATLAB进行算法的开发更加简便,其具有良好的
24、图形用户界面,而操作也变得更加的简单 9。Matlab具有面向对象编程的特点,是一种矩阵/阵列语言,用户编写的文件是以.M结尾的文件,可以通过命令执行单个函数,也可以整体执行.M文件。MATLAB语言采用C+语言进行编写,但用户在使用MATLAB进行计算以及算法上的开发时,其风格更加接近于实际当中的数学运算,这样使得开发起来更加的方便和简单,即使是非计算机专业的科技人员也能使用,同时可移植性比较强,可以被应用在多个行业的科学研究或者计算当中。MATLAB能够满足用户对各种计算功能上的使用,具有强大的计算算法,同时包含大量的数学运算函数 10。新版本的MATLAB在图形用户界面(GUI)技术上也
25、做了很大的改进,对图形界面有特殊需求的用户可获得很好满足。MATLAB对专门行业的开发也提供了工具类和模块,其功能十分强大,用户可以直接拿来使用,来满足自己对于数学计算方面的需求,行业涉及广泛,诸如数据采集、概率统计、优化算法、样条拟合、神经网络、信号处理、图像处理、系统辨识、偏微分方程求解、控制系统设计、LMI控制、小波分析、鲁棒控制、模型预测、模糊逻辑、金融分析、地图工具、非线性控制设计、实时快速原型及半物理仿真、嵌入式系统开发、定点仿真、DSP与通讯、电力系统仿真等,都在工具类(Toolbox)家族中有了自己的一席之地11。22 J2EE介绍J2EE是一个可跨平台的的企业级平台,通过这种
26、开发方式,使得系统具有很强的移植性,同时可以被部署在Windows操作系统或Linux系统上。开发者只要按照J2EE标准进行开发的平台,可以结合多种开源框架进行开发,同时避免了自己开发的持久层框架耗费多余时间,并且避免功能不全,只要遵循J2EE标准,平台就可以被部署在多种应用服务器上。通过一个多层的分布式应用程序模型完成对J2EE平台的使用系统依照其实现方式的不同将功能封装到不同的组件当中,使组件分别负责不同的功能,从而实现系统的横向扩展,这种开发方式使得代码在维护时变得更加方便,使业务逻辑与视图相分离 12。(一)J2EE组件组件可以被重复利用,在J2EE中,组件属于Web组件、EJB组件、
27、客户端组件,或者是应用组件中的一种,包括客户端组件、Web组件以及业务逻辑组件13。(二)J2EE容器EJB容器用于为EJB组件提供各种系统级别的服务,如安全管理和事务管理,用于充当中间件的角色,并且对EJB组件进行有效的管理,目前比较流行的容器包括WebSphere、Tomcat、Weblogic和Resin等14。(1)容器服务没有容器,实现J2EE的程序就无法运行。因此,在运行J2EE程序前,需要为J2EE中的各个组件和J2EE应用程序指定容器的设置,包含事务管理、安全性、远程连接和Java命名目录接口等15。下面是其主要部分:1.J2EE的事务模式是让开发者通过方法间关系来组成单一事务
28、,这样使得同一事务中的所有方法将被当成相同的单一整体。2.J2EE的安全性模式是要想访问Enterprise Bean需要用户被授权。3.J2EE远程连接模式提供了客户端和EnterPrise Bean之间底层通信的管理功能16。4.JNDI搜寻服务提供的接口是统一的17。J2EE体系提供了方便的可配置服务,以及数据持久化等功能19。(2)容器类型既然J2EE有多个组件,那它也就有多个J2EE容器,J2EE容器有如下几种。1.EJB容器:一个J2EE服务器提供EJB容器和Web容器。2.Web容器: Web容器负责J2EE中的页面以及请求的执行,Web组件和它的容器也运行在J2EE服务器中,系
29、统中采用的是WEB容器。4.Applet容器:是运行在客户端的Java插件以及Web浏览器共同组成,负责应用的运行。23 JSP介绍JSP(Java Server Pages)是通过很多公司共同制定的动态网页技术标准,主要由SUN公司提出。JSP在服务器端运行,返回给客户端的是HTML文本,客户端需要有浏览器进行查看。服务器接收到JSP发送的请求后执行JAVA代码段(网页跳转,数据库操作)然后将结果返回给发送请求的客户端,在功能上与JavaServlet相似。数据处理通常不在JSP中进行,JSP只是用来对用户使用的界面进行展示,通常是提取数据,业务处理不在其中。而且大型的Web应用程序的开发需
30、要Java Servlet和JSP配合才能完成20。JSP技术所开发的Web应用程序是基于Java的,因此可以实现跨平台,JSP将页面的设计和显示与业务逻辑相分离,实现组件重用,加快Web的应用程序的开发。(1)跨平台JSP技术以Java为基础,所以是跨平台的,可以被运行在多种系统上,如windos、Unix等。(2)业务代码分离采用JSP技术开发的项目, HTML语言实现界面的静态部分,而使用JSP标签和Java代码片段完成代码动态部分。程序员可将业务部分的代码放在JavaBean中或是交给Servlet或Struts这样的控制层,使业务部分的代码从视图层分离出来。(3)组件重用JSP中的业
31、务逻辑的访问可以通过JavaBean来编写,业务逻辑代码通过使用JavaBean类来将数据进行抽象,使用其中的get/set方法来进行赋值和获取,这个JavaBean可以在项目和JSP页面中被重复使用。JavaBean还可在其他Java应用程序中被使用。(4)继承Java Servlet功能Servlet是Java Web开发早于JSP出现的。在Servlet类中的Java和HTML代码,接收到用户请求后将结果页面返回给浏览器,这是通过输出流来完成的。但缺点是HTML代码在类中编写是非常不方便的,可读性很差。在JSP技术出现后, Web开发应用程序变得方便很多,而且JSP需要被编译成Servl
32、et后才能对用户的请求进行响应。(5)预编译在用户访问JSP页面时,必须要通过服务器将JSP的代码进行预编译,在编译后,服务器会对编译好的程序保存在服务器当中,当用户再一次访问JSP时,编译好的程序将被直接执行,这样可以提高用户对页面的访问速度,提高用户体验。JSP在开发上比较容易,完全的面向对象,与开发平台无关,主要面向因特网的所有特点,并且安全可靠,简化了动态Web内容的传输。JSP的运行方式如下:当用户向浏览器发送请求时,HTML文件经过预编译后,形成Servlet后,再返回给用户,对用户的请求作出响应,JSP中可实现对数据的动态显示。如果该JSP文件没有被修改过,当浏览器再向服务器发出
33、请求时,JSP文件将不会再被编译,而是直接执行已编译好的Servlet21。24 数据库介绍(一)JDBCJava数据库连接,简称JDBC,帮助用户实现Java与数据库之间的连接,按照JDBC的标准,用户可以设置访问数据库的访问信息,设置空闲时间等。JDBC有如下3种组件。(1)JDBC测试工具包、JDBC管理器和JDBC-ODBC桥。 (2)JDBC管理器是JDBC中的支柱。驱动程序管理器很小同时很简单;主要功能是将JDBC驱动程序和Java应用程序正确连接上,然后马上退出。 (3)不同的数据库使用不同的JDBC驱动包,JDBC驱动能够提供相当的可信度。通过JDBC测试的驱动程序被当作是符合
34、JDBC标准TM的。 (4)JDBC-ODBC桥使ODBC驱动被当作JDBC驱动程序使用,提供了不常用的数据库管理系统的调用方法。(二)ORACLE数据库ORACLE是被广泛使用的B/S体系结构或客户/服务器(CLIENT/SERVER)的数据库之一,是美国ORACLE公司(甲骨文)提供的以分布式数据库为理念的数据库产品。作为通用的数据库系统,ORACLE是被使用最多的DBMS。Oracle数据库最新版本为Oracle Database 12c。Oracle数据库的多租户体系结构使得其可以方便的使用在云平台上。此外,一些创新特性可最大限度地提高资源使用率和灵活性,如Oracle Multite
35、nant可快速整合多个数据库,而Automatic Data Optimization和Heat Map能以更高的密度压缩数据和对数据分层,其安全性以及可靠性,和对大数据的强大处理能力,使其成为管理数据库云平台的理想选择。Oracle数据库的特点:(1)数据管理功能的完整性:1)数据在保存上的持久性2)大量性3)可靠性4)共享性(2)产品具有完备的关系:1)保障访问2)信息表中的数据在关系型DBMS显式的表示,在逻辑上都应该采用同一种方法,那就是信息准则;3)逻辑性和数据在物理上的独立的准则4)视图更新准则是如果视图表中的值发生变化,在对应视图的值也要同时发生变化。(3)处理功能采用分布式:O
36、RACLE数据库的分布式处理的功能由很多ORACLE关系数据库以及其他非ORACLE的关系型数据库产品构成。(4)用ORACLE在数据仓库的操作是很便捷的,优点是可扩展性强;可用性强;稳定性强;数据安全性强。25 模式设计介绍MVC全称模型视图控制器(Model View Controller),将业务逻辑与数据进行分离,业务逻辑在一个组件中,使数据交互和页面同业务逻辑相分离,在修改时不需要改动业务逻辑的代码,映射传统的输入、处理和输出功能在一个逻辑的图形化用户界面。作为目前非常流行的J2EE开源产品之一,Spring为企业应用的开发提供了一个轻量级的解决方案,提供了一种统一的架构方式,融合了
37、大量的中间层模块,能够大大简化J2EE开发过程。IoC(Inverse of Control,控制反转)是Spring容器的内核,其他功能都构建在此基础之上。AOP的英文全称是Aspect Oriented Programming ,中文含义是面向切面编程,可以将不应该聚合在一起的功能从业务操作代码分离并提取出来,使用依赖注入的方式注入到业务代码中,降低了代码的耦合度,提高了代码重用率。ORM(Object Relational Mapping)是能使实体和关系型数据库之间进行映射的技术,也叫实体关系映射模型。是把数据库中的表中的元素与对象的属性一一对应,以对象的形式操作关系型数据库。ORM通
38、过关系将实体与对象之间进行联系,这种关系可以是一对一,多对一,或一对多,操作对象中的字段将数据持久化到数据库。ORM是在持久层与业务逻辑层间起到桥梁的作用,使对象(Object)到关系(Relational)实现映射(Mapping)。在Hibernate框架中,ORM的设计思想得以具体的实现。Hibernate主要通过Hibernate映射文件、Hibernate配置文件、持久化类和关系数据库间实现交互。映射文件描述数据表与持久化类之间的映射关系;通过持久化类来实现对对象的操作,描述关系数据库中的数据表结构;配置文件用于指定Hibernate的属性信息等,如数据库的连接信息等。26 本章小结
39、本章介绍了Matlab开发语言以及J2EE平台技术其中包括组件和容器的介绍,还介绍了JSP技术包括JSP的特征和构成组件,对Java数据库连接方式JDBC进行了介绍,Oracle数据库进行了概述。并对本系统设计时所采用的设计模式进行说明。 第三章 系统需求分析本章主要对中国移动基于语音识别的情感分析系统的需求进行分析和并且对这个系统中所使用到的算法进行分析。31 系统总体需求分析中国移动用户在日常生活中有一些问题需要通过拨打中国移动的10086客服电话来了解其在使用中遇到的问题。有些问题可以通过系统智能的回答问题,而有些则需要通过人工服务,即电话服务来完成,这些电话会被录音,但录音信息不能像文
40、字信息一样便于查找和分析,不能判断其在这次通话中是否能够得到满意的回答。系统将通过语音识别来记录一些对话中的关键词,然后再进行分析看客户致电时的情绪如何,从而智能的判断和收集客户的满意度信息。根据对语音情感识别分析系统的使用需求,将本系统所涉及的人员划分为如下四种,即移动话务员、移动客户、公司领导和系统管理员。中国移动基于语音识别的情感分析系统的总体功能用例图如图3-1所示。(1)客户首先可以确定的是客户是移动公司外部的人员,大部分是使用移动公司相关产品的客户群体,当然也包括即将成为移动公司客户群体的潜在客户,这些人的共同特点就是需要进行电话帮助的一类人群,当电话接听后,则移动公司的话务员将会
41、与客户进行沟通,那么沟通过程中产生的语音信息需要被系统记录下来,并由系统对语音信息进行一些预处理,这个预处理过程包括:采样、预滤波、量化、端点检测、加窗、预加重等部分,同时还需要进行情感特征的提取,分析后将这部分数据保存到数据库中。(2)话务员话务员是移动公司的客户服务的一个重要职位,之前已经分析过客户,话务员就是接听客户电话的移动公司员工,是沟通过程中的参与者,同时,在当次通话结束后,系统将对整个过程中产生的语音信息进行处理、分析,并对语言中提取的情感信息进行模式匹配分析,从而得到分析结果,记录到相应的话务员考评成绩当中,所以话务员是服务考评的被考评对象。而且在分析本系统的功能时了解到,话务
42、员不只需要参与语音信息的记录,还可以查看自己各次沟通过程中所产生的情感分析结果,即系统通过语音识别以及情感分析自动生成的客户的满意度结果,这样可以对自己的沟通进行改进,另外如果对系统的考评结果不满意时需要本系统提供一个信息反馈的功能,可以将反馈内容通过留言板或邮件的形式发送,由领导进行处理。最后,在系统中会有一些公告进行发布,所以话务员还需要有查看系统中发布的公告内容的功能。图3-1 系统总体功能用例图(3)公司考评领导公司考评领导也是移动公司的员工,是话务员的领导,负责服务考评工作,所以公司考评领导对于系统的使用需要主要是查看情感分析的结果、在系统中设置考核指标、在系统提供的信息反馈功能功能
43、中,处理话务员所提出的意见,还需要通过邮件将一些信息发送给话务员,如个人的考评指标等。公司考评领导还需要发布培训、考评结果等类似公告信息。所以在系统中对于上述的功能需要有操作的权限。当然无论是话务员用户还是公司考评领导用户都需要通过已经设定好的系统的访问权限和密码判定才能登录系统。(4)系统管理员系统管理员是系统的管理维护人员,负责整个系统的管理、运营和维护工作。在本次研发的语言情感识别系统中,系统管理员所操作的功能主要是系统功能以及信息反馈功能。因为系统功能中可以对使用系统的用户信息进行设置,包括使用系统的用户基本信息、以及其所在的部门信息(包括每个话务员所在的部门或者考评部门)、可以使用哪
44、些功能的权限信息等,其被设置的用户主要是公司考评领导和话务员两种用户。系统管理员的信息反馈功能可以通过公告发布系统的维护公告,版本升级信息等。如果话务员和公司考评领导两种用户有对系统的反馈意见也可以通过信息反馈功能发送给系统管理员,由系统管理员用户进行处理以及对意见进行回复。32 系统功能分析中国移动基于语音识别的情感分析系统按照功能可划分为三大模块,即系统管理模块、语音情感分析结果模块和信息反馈模块,为了论述清晰将语音情感分析结果功能中的结果数据来源进行单独的功能分析。321 系统管理功能分析系统管理功能部分,根据之前的总体用例分析,系统管理功能包括人员设置功能和考核指标的设置功能。(1)人
45、员设置的功能分析:该功能的使用用户主要是系统管理员,被设置的人员是话务员用户和公司考评领导用户,不包括客户,本系统只是取得客户的沟通声音,不对客户进行管理。人员设置功能包括对某一系统用户的基本信息设置、部门设置以及权限设置。如图3-2所示。基本信息设置:人员信息管理是人事管理中不可缺少的内容,管理的信息包括人员的自然信息,是人事部门管理其他系统的基础。对人员的信息进行的维护可以帮助中国移动公司在对员工的个人信息管理上实现快速、科学以及有效的档案建立,并且提高了整体的工作效率。该功能主要用于管理系统访问者的信息,系统管理员需要管理用户编号、用户使用系统的账号、使用系统的密码 。部门设置:公司部门
46、设置具有重要意义。在具有科学的部门结构的公司中工作,可以提高工作效率,发挥部门领导人的才能;如果公司部门结构混乱且职责不明,管理人员的工作效率也会降低。每个部门有其各自的职责,对系统的操作也有不同的需求,该功能主要是对操作用户所属的部门进行信息的维护。图3-2 人员设置功能用例图权限设置:权限是指系统使用者可只能使用自己被管理员所授权的系统菜单,其他菜单不容许被访问,只要有用户和密码的系统,几乎都会有对权限的设置。用户需要让系统知道操作该系统的是谁,系统才会知道应该暴露给用户哪些功能。按照对系统的操作控制力来分,可将角色分为系统级别的控制和数据级别的控制。该功能主要是根据用户所属部门的不同,对用户可操作和查看的系统菜单的权限进行设置。(2)考核指标设置的功能分析:该功能的使用用户主要是公司考评领导,绩效考核指标内容的设置,首先需要设置公司的年度目标各部门的考核指标内容是根据公司的年度目标再分解到各部门。各部门再分解到各小组或个人。公司考评领导可根据满意度的指标对各小组乃至个人进行指标的设定,来完成对小组或个人在接受咨询、投诉或建议时是否得到满意回答的结果进行统计和分析。322 数据来源功能分析中国移动语音的情感识别的流程是:将用户拨打电话后的语音信号通过预处理和数字化后,从而将语音信号通过端点检测,然后再对语音信号进行特征分析。端点检测是指在有噪音的环境下从中找出哪些是语音哪些