面向步态变化场景的智能终端身份认证研究.docx

上传人:李司机 文档编号:7152149 上传时间:2024-06-15 格式:DOCX 页数:26 大小:173.29KB
返回 下载 相关 举报
面向步态变化场景的智能终端身份认证研究.docx_第1页
第1页 / 共26页
面向步态变化场景的智能终端身份认证研究.docx_第2页
第2页 / 共26页
面向步态变化场景的智能终端身份认证研究.docx_第3页
第3页 / 共26页
面向步态变化场景的智能终端身份认证研究.docx_第4页
第4页 / 共26页
面向步态变化场景的智能终端身份认证研究.docx_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《面向步态变化场景的智能终端身份认证研究.docx》由会员分享,可在线阅读,更多相关《面向步态变化场景的智能终端身份认证研究.docx(26页珍藏版)》请在三一办公上搜索。

1、面向步态变化场景的智能终端身份认证研究摘要受到当前大数据趋势的推动,生物识别技术的进步逐渐成为国内外研究人员关注的焦点。步态是人体重要的生理行为之一,通过分析人的步态信息可以获得其身体内部各种器官的功能活动情况以及健康状况,从而为人类疾病诊断及治疗提供依据。尽管传统的生物特征信号如指纹和虹膜等具有一定的价值,但随着生物特征识别技术的不断进步,步态识别作为一种基于受试者行走步态来进行身份识别的新技术,因其采集简便、识别范围广泛和不易被隐藏的特点,已经吸引了国内外多个研究机构和高等教育机构的高度关注。同时,智能手机作为移动设备中最普及的终端之一,其功能不断增加,因此,将智能手机应用到步态识别方法中

2、有着重要意义。现阶段,步态识别的研究主要集中在图像序列和运动传感器上,但基于智能手机的步态识别技术仍是一个尚未完全探索的领域。文在智能手机的基础上设计并实施了一个实时身份验证系统。本论文首先分析了当前国内外关于身份识别技术发展现状并进行了比较与选择。该项目主要涵盖了四个核心部分:总体设计、身份验证模块的设计、数据库的构建以及系统的测试。其中身份识别模块包括人脸检测与匹配算法、特征提取与分类算法两个功能模块。在整体设计的章节中,我们主要探讨了整体框架、开发环境和移动端的功能特点。在身份识别模块方面,主要描述了指纹采集和匹配算法。在身份识别模块的部分,我们主要探讨了身份识别的整体结构和操作流程。在

3、数据库设计部分则介绍了用户信息的管理和权限控制,并给出了相关流程图。在数据库设计的章节中,我们主要探讨了用于保存数据的表格设计方法。识别系统在系统测试环节得到了全面的检验。第一章绪论1.1 研究背景与目的在最近的几年中,群智感知逐渐受到科研工作者的重视,这为大数据收集提供了一个非常有利的环境。群智感知就是在这样的背景下提出的一个概念。其核心目标是利用用户及其所佩戴的移动设备来完成大型的社会感知任务。传统的传感器采集数据需要耗费大量人力物力,且不能够实时更新,这极大地限制了其应用范围。然而,随着智能手机技术的飞速进步,用户现在可以通过其内部的传感器(例如加速度和陀螺仪)来收集和分享数据,这无疑将

4、极大地提高人们的生活品质和水平。这篇文章探讨的是基于智能手机步态识别的概念,即人们使用智能手机进行数据收集、分析和处理,从而准确地识别自己的步态。目前该领域研究人员已经开始将这种新技术应用于智能交通、安防以及健康监护等多个方面。该技术旨在通过手机内部的加速度传感器和陀螺仪等设备,运用机器学习的方法来识别人们的步态信息,并通过精心设计的模型结构来增强识别的准确度和稳健性。目前国内外对于智能手机上步态识别方法的研究还不是很多。利用智能手机内置的传感器来收集步态信息,能够突破依赖摄像头和惯性传感器进行数据采集的传统限制。本文以人体运动学原理为基础,结合计算机视觉算法实现了人行走时的姿态变化以及步态周

5、期特征的提取,并最终将这些参数作为步态识别的输入变量,进而得到步态序列图像。本研究的识别成果不仅适用于身份鉴别,而且在这一研究成果里,通过使用智能手机来收集步态信息,为步态数据采集开辟了一条全新的途径。由于基于智能手机采集步态数据所需设备简单且成本低廉,因此该系统具有很好的实用性和经济性。这种通过智能手机收集步态数据并进行深入分析的创新数据采集方法,不仅可以用于其他多种场景,如情绪检测、健康检查和醉驾检查等,而且在不同的场景中,所采集的数据对象和信号都会有所不同。1.2 国内外研究综述目前,智能手机正变得日益普及,其内置的高精度传感器为数据采集开辟了一条全新的途径。在过去几年中,一些研究人员通

6、过对人体行走时产生的震动进行分析,发现其可以作为生物特征用于身份认证。NickelC及其团队采用了智能手机内部的加速度传感器来收集参与者走路和上下楼梯的数据信号,并在识别过程中使用了隐马尔科夫模型。YodpijitN及其团队开发了一种可以预测健康状态并减少医疗开销的备选技术。本文在这些方法基础上提出了一种基于智能手机加速度的特征提取方法,并通过实验验证其有效性。经过研究,我们发现利用峰值检测算法从智能手机的加速度数据中抽取特征是完全切实可行的。本文基于智能手机采集的人体行走时的加速度信息对现有的特征提取方法进行改进,并将改进后的算法应用于模式识别领域。通过峰值检测算法计算出的步态特征涵盖了步幅

7、时间、摆动时间以及步频等多个方面。这些特征与健康状态密切相关,因此对它们进行训练并应用于智能辅助驾驶系统将具有重要意义。ZouQ及其团队M在没有外部限制的情况下,利用智能手机收集了118名参与者的步态信息,并采用深度学习方法进行模型构建,他们提出了一种混合深度神经网络技术,该技术的识别准确率高达93%o实验表明,该模型具有较高的准确度,能够用于对运动行为的分类。ZakiTHM及其团队利用智能手机的内置加速度和陀螺仪传感器,收集了饮酒者在饮酒前后的步态数据。通过应用深度神经网络算法,他们能够预测用户是否在饮酒,预测准确率高达79%。根据上面的调查研究,使用步态方法来识别人的身份是完全切实可行的。

8、此外,许多研究人员在这一领域已经取得了相应的研究成果。因此,在未来,为了进一步优化身份识别的即时性和效率,使用基于智能手机的身份识别技术将成为一个更为优越和广泛应用的选择。用户可以使用智能手机内部的传感器来收集受试者的步态数据,并将这些数据上传到服务器。在PC端,用户可以对这些数据进行分析和处理。通过滑动窗口技术,用户可以提取每个窗口的步态数据特征,并将这些特征输入到分类算法模型中进行训练,从而建立一个身份识别模型,实现对用户的识别。1.3 本文的主要工作在AndrOid操作系统的基础上,我们设计并开发了一个步态识别系统,该系统的功能被划分为四大部分:用户界面、修改功能、数据收集功能以及身份验

9、证功能。在该平台上对人体行走过程中产生的步态特征数据和运动参数等信息进行提取和分析,然后利用分类器实现步态分类识别。用户模块负责管理用户的注册和登录流程,而修改模块则负责修改用户的基础信息。数据采集模块则负责收集受试者的步态数据并将其上传到服务器。身份识别模块则负责构建身份识别分类模型,以便受试者能够通过步态识别来确认自己的身份。1.4 本文的结构安排这篇文章重点探讨了如何利用智能手机内部的加速度和陀螺仪传感器来识别受试者的步态的技术策略。在对人体运动机理分析的基础上,通过实验验证了基于手机内置的加速度和陀螺测量数据与步态参数之间存在较好的相关性,并以此为依据提出了一种新的步态识别方法。这篇文

10、章主要被划分为六个章节,每个章节的详细结构如下所示:首章,引言部分。其次,阐述了目前在人体运动状态检测和分类方面存在的问题以及对其进行研究的必要性。首先,我们探讨了基于智能手机步态识别技术的研究背景和其深远的意义。其次,提出了本文的技术路线和研究方法。接下来,对目前国内外的研究状况进行了简洁的概述。文末,我们概述了这篇文章的核心内容和框架结构。在第二章中,我们将介绍相关的知识背景。这篇文章详细描述了在移动设备上使用的AndrOid开发操作系统的相关知识。在第三章中,我们研究了数据的收集和识别方法,选择了加速度和陀螺仪传感器来收集步态信息,并运用机器学习技术对这些步态数据进行了深入的分析和处理,

11、最后采用经过参数优化的随机森林算法作为步态识别的分类模型。在第四章中,我们探讨了基于智能手机的身份识别系统的设计。首先,我们对整个系统的整体框架、开发环境以及移动端的各个功能模块进行了详细介绍。再次,对各个功能实现的方法及步骤做了详细说明。接下来,文章详细描述了身份识别模块的整体结构和详细的操作步骤。最终,我们对系统内的数据库设VHS行了详细说明。最终,进行总结并对未来进行展望。本文对目前已经完成的各项工作进行了全面的总结,并明确指出了本研究工作中需要改进的方面、存在的问题和挑战,同时也对未来的研究方向进行了前瞻性的展望。第二章相关知识背景介绍2.1Android操作系统Android是谷歌公

12、司推出的基于1.inux平台的操作系统,经过十几年的不断更新和迭代,对于用户来说,它的功能日益完善,同时用户的体验人数也在不断增加。随着移动终端技术的不断发展,智能手机成为人们生活中不可或缺的一部分。目前,它在市场上的份额已经大大超过了IOS,像华为和小米这样的手机在这一领域已经获得了显著的成就。随着智能手机用户的增加,智能手机终端硬件性能不断提升,安卓系统成为主流的操作系统之一,同时也推动了整个软件市场的发展。同时,对于开发者来说,开发工具的进一步完善使得整个开发流程变得更为高效和简便。Android的开发方向可以细分为应用程序开发和底层开发两大类,正如图2.1展示的那样。本研究中设计的移动

13、端APP开发是应用程序开发领域的一部分。应用程序开发方向一A-A软件泅试优化Androld开发名双体开发业动开发内核改造一-底层开发方向一A系统移植定制忏发图2.1Android开发的两大方向图Android管理系统是为移动设备设计的平台,包括操作系统、中间件和应用程序。从框架图出发,可分为操作系统层、各种库、Android执行环境、应用程序框架和应用程序。每层结构详见图2.2。面向步态变化场景的智能终端身份认证研究应用程序层主屏幕、电话、联系人、浏览器等应用程序框架层活动管理器、窗口管理器、内容管理器、视图系统等系统库1.ibC函数旅、数据存储等持久层库、Dalvik虚拟机器AndrOid运

14、行环境1.inUX内核层显示驱动、相机驱动、蓝牙驱动.键盘抠动等图2.2Android操作系统的组件结构图2.2传感器2.2.1 传感器介绍近几年,随着物联网技术的飞速发展,传感器也逐渐为大众所熟知。在日常生活中,我们经常可以看到或使用这些传感器,如智能手机上的步计或楼道中的声音指示灯等。在这些应用当中,最常见的是通过使用各种传感器来感知环境信息以及人体状态信息。在这一章节里,我们将深入探讨AndrOid系统中传感器的基础知识,并特别强调本文所使用的加速度和陀螺仪的详细描述。在AndrOid的操作系统里,主要的内部传感器涵盖了加速度、陀螺仪、磁场、方向和压力等功能。其中,加速度和磁力是最常见且

15、最为重要的传感器,其准确性直接决定着整个系统的稳定性。在传感器控制系统里,该系统不仅会主动地向上级报告传感器在准确性和数值方面的变化,还会提供传感器准确度的接口,这些接口可以在JaVa技术的应用场景中进行操作。通过这些接口可以使用户能够直接查看传感器数据的准确性和精确度。图2.3展示了AndrOid传感器操作系统的基础层次结构。第二章相关知识背景介绍.XndrolJIJAiidroid系统,r靠向泞也Scnsg的户a先本他也基SZ三个方向的加速度信息,但这些数据可能会受到重力加速度的干扰。通常情况下,当人们获取到智能手机内置的加速度传感器数据时,如果手持该智能手机的人的手臂出现抖动,或者在获取

16、加速度数据时处于摇晃的环境中,那么手机内置的加速度传感器的数值增幅将会受到震动影响。因此,为了获得准确的结果,必须去除这些短时记忆信息所引起的长波效应的影响,从而得到精确的数值。手部的摆动和身体的轻微震动都是长波干扰的表现形式。只有在排除了这种长波干扰后,我们才能准确地获取高精度传感器的数据。为了消除这些长波干扰,可以采用低通滤波(1.ow-passFilter)过滤器来实现这一目标。相对而言,在AndrOid应用程序中,有时也需要获取瞬时加速度的数据。例如,在开发计步器时,如果想要测量加速度的急剧变化,就需要消除短波的影响,这样才能获取所需的数据。另外,我们还发现在手机上安装应用程序时,如果

17、没有过滤掉短波长的信息,则会导致结果误差很大,这就是所谓“短视效应然而,这种方法与1.OW-PaSSFilter的处理策略截然不同,因此,这种能够消除短波干扰的过滤技术被称为高通滤波(High-PaSSFiIter)。面向步态变化场景的智能终端身份认证研究y轴图2.4加速度传感器图2.2.3 陀螺仪在Android操作系统的环境下,陀螺仪传感器被分类为TYPE_GYROSCOPE,其单位是rad/s。该传感器能够测量设备在x、y、Z三个轴向上的角运动加速度数据,也被简称为Gyro-sensor角速度器。陀螺仪主要用来监测人体姿态及身体姿势的改变,同时还能对人的位置进行定位。利用内部的振动机来测

18、定物体旋转时产生的角速度,从而确定物体的移动角度,并监测其水平状态的变化,但这并不能估算出物体的运动强度。为了克服传统方法存在的问题,提出一种基于加速度的智能监控系统。不同于加速度,加速度能够测量轴向的线性运动,而陀螺仪可以很好地检测旋转和偏转方向的运动,因此可以非常准确地分析并确定用户的实际运动。陀螺仪的核心思想是,当旋转的物体不受到外部力量的干扰时,其旋转轴的位置保持不变。因此,只要知道了物体相对于某一固定轴的旋转方向就能测出该物体与这一轴上任意一点间距离和角度的关系,从而计算出这个点所代表的位置坐标。遵循这一原则,人们可以使用它来维持方向,接着采用某种方式来读取转轴所指示的方向,并将这些

19、数据信号自动传输至整个系统中。第三章数据采集与识别方法研究3.1 数据采集和处理3.1.1 数据采集在本次实验中,我们使用AndrOid智能手机开发了一个步态数据采集应用程序,该程序通过智能手机内部的加速度和陀螺仪传感器来收集步态信息,并据此构建了步态数据集。通过对不同性别人群以及老年人和儿童群体的分析发现,该平台能够有效地收集到人体运动过程中产生的各种步态特征信息,并且可以根据所获得的步态数据预测个体未来的健康状况。为了降低不需要的外部因素对本次实验的影响,我们在实验开始时选择了相同的位置进行数据收集,以减少因路面、气候等外界因素造成的干扰。同时通过设置不同时间段和步长来避免由于时间间隔过大

20、或过小导致的错误结果。接下来,我们应确保在收集步态数据时,受试者的步速保持一致。在进行数据采集的过程中,首先需要将手机固定在特定的采集位置,然后点击开始采集按钮,软件将会收集受试者步行一分钟的相关数据。在数据采集的实际操作中,有必要关闭手机屏幕,以最大程度地减少受试者与手机之间可能出现的摩擦或碰撞,从而避免数据采集过程中出现中断或其他异常情况。我们选择了手和腰部两个不同的位置来收集参与者的步态信息,每一个位置都收集了三组数据,每组持续一分钟。通过对这两组数据分别做时域分析、频域分析、时频联合分析来提取特征量,并利用支持向量机方法建立分类器,从而得到最终的分类结果。在这些数据中,有两组被选为训练

21、数据样本,而另外一组则被用作测试数据样本,从而构建了步态数据集。在CSV文件中保存了两个阶段收集的步态数据,首先将其存储在移动端,然后上传到服务器,以便在PC端进行后续的实验。通过对每一步骤处理后得到的运动参数计算出人体各个关节角度并绘制成曲线图。CSV的每一份文件都储存了三轴的加速度和陀螺仪的数据,总共有6列。文件的命名遵循正整数的顺序,每位用户在其特定位置都有一个CSV的数据文件,但这些文件的名称都是一样的,并被分配到不同的文件夹中。3.1.2 传感器数据的比较在开始收集步态数据并构建数据集之前,选择合适的步态信号是至关重要的,因为这涉及到选择哪种智能手机的内置传感器来收集数据。基于此提出

22、了一种利用不同类型传感器获取步态信号并结合人体姿态信息分析的识别方法。为了提高身份识别的准确性,我们选择了合适的传感器来捕获步态信号,并构建了步态数据集。此外,我们还计划采集加速度和陀螺仪的数据进行相关实验。为了获得更准确的特征信息,采用基于深度神经网络的分类器对所得到的样本进行训练和测试。musale及其团队采用了结合加速度计三轴数据和线性加速度三轴数据的研究方法,并与本研究的方法进行了对比,研究结果如图3.1展示。结果表明,采用该算法后得到的步态特征点位置更加准确。从提供的图表中,我们可以观察到,在随机森林、KNNSVM分类模型中,本研究的方法都展现出了优越的识别准确性。因此,利用加速度和

23、陀螺仪传感器收集的三轴数据来进行步态身份的验证会得到更为准确的结果。图3.1不同模型下传感器数据比较3.1.3 数据预处理利用安卓智能手机在移动设备上开发的APP,我们收集了受试者的原始步态数据,并将这些数据用作实验的数据集。但是,在数据采集过程中,可能会产生一些传感器数据的误差,例如系统误差、噪声、时间延迟或数据丢弃等,这些误差的产生会影响数据的准确性。如果不能有效地剔除这些误差对分析结果的干扰,就无法准确获得原始数据所反映的真实人体运动状态。因此,在开始提取步态特征之前,有必要先对收集到的原始加速度和陀螺仪信号进行适当的预处理。在数据收集过程中,鉴于手机会从多个方向收集步态信息,这些不同方

24、向的信号会变得更为复杂,使得对齐变得更为困难。为此提出了一种基于三轴加速度信息来识别手转向并将其转换成数字信号的方法。为确保幅度信号在旋转过程中保持稳定,三轴加速度在进行数据信号的规范化收集时,采用了特定的方程式来计算加速度数组的重力修正幅度:如历杆后毕其中x、y、Z分别为加速度X轴、y轴、z轴的数据,t为第t组,n为组数。由于智能手机的加速度计和陀螺仪具有很高的精度,因此对人体的运动非常敏感,这可能会产生噪音。传统基于卡尔曼滤波的算法存在收敛速度较慢,易受系统状态影响等问题。为确保信号的稳定性,我们必须对原始的信号数据执行滤波和分割操作。提出了一种基于自适应阈值函数法的去噪算法。我们使用滑动

25、窗口技术对数据信号进行了切分,根据100个数据样本的大小来划分窗口,并计算了这些窗口的平均移动距离,以确保数据的高质量和均衡性。通过分析各个时间段内每个采样点采集的时间序列值,确定各时刻对应的均值,并将该结果保存为数据库中。首先移除传感器在前5秒和最后5秒收集的数据样本,然后从中提取数据样本作为最终的数据集,这样做是为了确保实验数据的稳定性和降低噪声。3.2 特征值提取3.2.1 特征值及选取分析特征提取在信号处理中起到了关键作用,它不仅能提升数据分类的速度,还能降低处理时间的复杂性。因此,对信号的特征提取是信号处理中非常重要的一环。在对原始数据信号进行预处理之后,我们会选择适当的特征进行抽取

26、,其中常见的特征提取手段包括时域和频域的特征抽取等。鉴于时域特征的提取过程既简洁又高效,因此我们选择了时域特征的提取方法。将提取后的时域特征向量作为分类器的输入,并利用支持向量机算法对其训练和识别。在进行时域特征提取时,我们选择了七种容易计算的时域特征,包括平均值、最大值、最小值、标准差、中值、偏斜度和峰度。这些特征被划分为200个数据样本的窗口大小。在随机森林模型中,我们计算了featureimportances参数以表示每个特征的重要性,其中参数的最大值为K当数据大小接近1时,这意味着该特征在分类过程中的重要性更高。以采集自手臂的数据为研究对象,我们选取了3000条样本数据作为实验的数据集

27、,具体结果可以参见表3.1。表3.1时域特征比较特征值44A1G,GGt平均值0039300382005400156001070006标准差00328003420027002740037I0029I中侑003670035200515001470015300104最大值0.02720.02920.02220.0173001930.0223最小值002330028900225001570021700255偏斜度OOI840017900149001280013700189稣度001790.0160.01200157001420.025I其中Ax、Ay、Az、Gx、Gy、GZ代表加速度x、y、z轴的方

28、向以及陀螺仪x、y、z轴的方向,从而得到相应的feature_imporlances_参数值。从表3.1中我们可以观察到,在进行分类时,平均值、标准差、中值、最大值和最小值这些时域特性显得尤为关键。不同的参与者在峰度值和偏度值上的相似概率相对更高,这意味着偏度和峰度对于识别的准确性的影响是微小的。最后,我们选取了除偏斜度和峰度之外的另外30个特征作为模型输入,这五种时域特征分别对应于加速度X、y、Z轴方向以及陀螺仪X、y、Z轴方向的特征。3.2.2 分类实验在从三轴加速度和三轴陀螺仪数据信号中提取特征之后,这些特征子集将被用作分类算法模型的输入数据。分类器采用不同的特征描述子训练得到最终分类结

29、果。该研究主要集中在机器学习相关的分类算法上,目的是通过选择适当的分类算法模型来提升步态识别的准确性。针对现有分类器中特征提取方法单一以及训练集样本量不足问题,提出了一种融合多类特征选择与组合优化技术的步态识别方法。除了随机森林分类方法,还存在其他如决策树、支持向量机(SupportVectorMachineSVM)、K最邻近(K-NeareStNeighborKNN)和朴素贝叶斯等多种机器学习分类技术。这些方法都是根据样本对类别进行估计并预测目标类所属的类别,但这其中也有一些不足。除了Bagging,还有一些基于BooSting的集成技术,例如XGBoOSt。为了验证这些分类器对人体行走过程

30、中所采集到的大量步态信息进行有效地分类预测,提出一种新的方法来实现步态特征点匹配与运动轨迹跟踪相结合的智能识别方法。我们选择了手中的(DA)步态数据集,其中70%被选为训练集,而30%被用作测试集。经过一系列处理后,我们在这些数据集上对不同的分类算法模型在测试集上的性能和计算时间进行了对比分析,如图4.2展示的那样。100M)6040200.RFXGBomtSVMDccmrecKNN朴素贝W斯(八)准确度XGBoOslSVMDccisionTrccKNN朴索贝时斯(b)运算时间图3.2不同分类模型的性能测试在分类模型的识别精度上,随机森林模型在这一测试集上展示了最优的准确性,而支持向量机在实验

31、环境中也展示了相当不错的性能。在训练数据集选取时,使用了不同大小的样本进行分析对比。在本研究中,其他分类算法模型的准确性普遍低于90%,导致分类效果未能达到预期标准。在计算时间上,随机森林模型和XGBoost模型在分类任务上的执行时间明显超过了其他分类方法,同时,决策树的计算时间也超过了支持向量机、K-近邻和朴素贝叶斯的处理时间。因此,对于数据集来说,随机森林是一个较优的选择。随机森林与XGBooSt作为一个综合性的分类方法,其计算时间明显超过了其他的分类方法。而当决策树被视为树模型时,由于树的深度和枝叶的特性,它的计算复杂性自然会增加。因此本文选择了三种不同结构的分类器进行实验对比分析。尽管

32、随机森林和XGBoost都是集成算法,但从图3.2可以看出,随机森林的运行时间实际上比XGBoost要短。当选择适当的模型进行身份识别时,K近邻和朴素贝叶斯在分类能力和计算时间上展现出了类似的表现,但这两种分类器的效果并不尽如人意。3.3身份识别方法尽管随机森林在识别的准确性上展现得相当出色,但其模型性能会受到多种因素的制约,如决策树的数量和深度、叶子节点的样本数量以及在构建决策树时所选择的特征数量等。为了使随机森林能够取得更好的分类效果,需要对模型的主要参数进行适当地调整。在所有这些参数里,决策树的数量和其最大深度对随机森林模型的表现产生了最大的影响。为了提高随机森林模型的分类能力,需要对上

33、述参数进行调整以使它们达到最优组合。本研究主要针对数据集的这两项参数进行了参数调整实验,以使随机森林的性能达到最优状态。在随机森林调参方法中,主要存在三种主流方法,它们是交叉验证法、学习曲线法和网格搜索法。本文采用了一种新的算法网格搜索算法来对随机森林进行训练和预测。当多个参数需要同时调整时,网格搜索方法显得更为合适。在此基础上提出了一种新的基于网格搜索法与交叉验证法相结合的多参调参方法网格交叉验算法。通过学习曲线法,我们能够清晰地观察到模型性能如何受到各个参数的影响和变化趋势。交叉验证法需要大量样本才能得到较好效果。考虑到只关注了两个参数,并且这些参数之间是相对独立的。采用了一种基于多参率的

34、决策方法决策树算法,将其应用于调优时,发现学习后的模型对各个参数的敏感度不同。因此,我们选择了学习曲线法进行参数调整分析,以研究准确率与决策树数量和最大深度之间的关系。通过这种方法,我们确定了决策树数量和最大深度的合适范围,从而降低了模型训练的复杂性和计算时间。最终,在这些合适的范围内,我们使用网格搜索技术进行了参数的优化调整3.3.1 决策树的数量在研究决策树数量如何影响随机森林模型性能的过程中,我们通过逐步增加训练过的决策树数量来评估随机森林算法的性能,即模型预测的准确性,这一点在图3.3中有所展示。此外,我们还探讨了决策树数量如何影响模型的计算时间,正如图3.4展示的那样。图3.3决策树

35、数目影响模型性能的结果图图3.4决策树数目影响模型运算时间的结果图在这次试验里,我们选取了从1到lOOO的决策树数量,并在每次间隔中增加了10,以观察决策树数量的变动是如何影响模型整体准确性的。结果发现,对于每一种类型的数据,其最优的决策树个数是不同的,这与我们之前研究得出的结论一致。从图3.3可以观察到,在决策树数量介于1至100的范围内,模型的准确性会随着决策树数量的增长而急速提高;当决策树的数目介于100至500之间时,模型的准确性呈现出一个上下浮动的模式,但增长速度相对较慢;当决策树的数目超过500时,该模型的准确性基本保持稳定。因此,我们可以根据具体的应用需要来选择合适的决策树数目进

36、行训练和测试,以获得最优的模型结构和算法效率。总体而言,随着决策树数量的逐渐增多,分类的整体效果也逐渐提升。然而,当决策树数量达到某一水平后,进一步增加决策树的数量对于模型性能的提升是有限的。从图3.4可以观察到,决策树的数量与模型的运算时间是正相关的,也就是说,决策树的数量越多,模型的运算时间就越长,时间线呈现出波动上升的趋势。这说明,决策过程需要消耗大量时间来完成,而模型运算效率越高,就能节省更多的时间成本,从而提高系统性能。为了深入了解时间的具体变化,本次实验选择了局部作为研究对象,重点观察了放大决策树数量在200至400范围内的时间演变模式。结果发现,随着决策规模增大,决策树的平均长度

37、也随之增加。此外,该模型的计算时间呈现出波动的阶梯式增长,这主要是因为随机森林采用的是并行集成算法,每一棵决策树都是相互独立的。当多个进程启动时,每个进程都会生成一个决策树,然后将这个决策树放入队列进行训练,因此在一定的范围内,计算时间会保持不变。3.3.2 决策树最大深度在研究决策树最大深度对随机森林模型性能的影响时,我们通过逐步增加训练决策树的最大深度来研究随机森林算法的性能,同时也研究了决策树的最大深度对模型运算时间的影响,如图3.5所示。090807040302IO15202530(八)准确度015202S30决策树大深度(b)运算时间图3.5决策树最大深度影响模型性能的结果图从图3.

38、5可以观察到,在最大深度介于5至15的范围内,决策树的最大深度增加会导致模型从简洁转向复杂,从而使得模型的准确性大幅提升;当决策树的深度达到15至20时,模型的准确性会逐渐上升;当决策树的深度超过20时,该模型的准确性趋近于其最大值。本文对所有算法进行了分析和比较,发现对于不同规模的决策树,最优参数是不一样的,而这些结果与实际情况相吻合。总体而言,随着决策树深度的逐渐增大,该模型的整体性能也逐渐提升;同时由于训练数据集和测试数据集是随机分布的,所以模型的总体准确率并不高。然而,当决策树的最大深度达到某一特定水平后,进一步扩大决策树的最大深度对模型的准确性几乎没有任何负面影响。另外,在最大深度介

39、于5至20的范围内,模型的运算时间与最大深度成正比关系。随着最大深度的逐渐增加,模型的运算时间也会急剧上升。然而,当最大深度超过20时,模型的运算时间开始出现上下波动,但最终趋于稳定。随着最大深度的逐渐增大,模型所需的特征选择会逐渐减少,计算速度也会加快,而所需的计算时间则会保持不变,直至模型达到一个稳定的收敛状态。在综合权衡模型的效果与其复杂性之后,我们决定将深度的最大界限设定在20至30的范围内。最终,我们采用网格搜索方法对决策树的数量和最大深度进行了同步调整。经过5次交叉验证,我们得出了这样的结论:当决策树的数量为588且最大深度为25时,可以获得最理想的模型,其中随机森林模型的准确性最

40、高,达到了94.05%。第四章基于智能手机身份识别系统设计4.1 总体设计4.1.1 总体架构本研究采纳了图4.1展示的系统的整体框架。当参与者带着配备身份识别系统的智能手机在关键情境下进行身份验证时,该系统将对参与者进行身份识别,并在其手机上展示这一识别结果。为了使用户能够快速地了解被测试者的身份信息,该系统还具有认证功能,即对其使用的设备或行为进行验证。从总体设计角度看,参与者在移动设备上会利用智能手机内部的加速度传感器和陀螺仪传感器来收集他们的步态信息。同时,这些收集到的数据会被上传到服务器,然后在个人电脑上进行数据的预处理、特征提取和模型训练。完成这些训练后,模型会被部署到移动设备上,

41、从而在移动设备上进行身份验证。所有相关的数据都会被保存在MySQ1.数据库中。图4.1总体架构图4.1.2 开发环境在这篇文章的移动端设计与开发过程中,我们选择了AndrOid智能手机作为核心应用平台,并成功开发了一款专门用于收集步态数据和进行身份验证的APP。通过对用户进行问卷调查,了解用户对于该系统的使用情况,并根据问卷结果提出改进意见,以提高本系统的可靠性和可用性,为后续研究奠定基础。具体的开发环境描述如下:件平台:AMDRyzen7PRO4750UfeaturingRadeonGraphics1.70GHz,16GStorage;开发软件:AndroidStUdiol.4,JDKl.8

42、.0,Windowsl064bit;使用的平台是华为p20;传感器种类包括:加速度传感器(G-SenSOr)以及陀螺仪传感器(Gyro-SenSOr);4.1.3 移动端功能在系统的实施过程中,我们采用了华为p20这款智能手机作为数据收集的工具。在winl操作系统的支持下,我们将AndrOidStUdio选为手机APP的开发环境,并开发T一个可以收集步态数据并进行身份验证的移动应用程序。该系统主要由运动信息采集模块,用户管理模块,数据处理分析和显示模块组成,通过对人体行走姿态的实时测量及数据分析处理后生成相应的健康报告或危险预警。如图4.2展示的是PC端软件开发平台的用户界面。图4.2开发软件

43、平台界面图在移动端的APP设计中,主要涵盖了四个核心模块,它们是:用户界面、个人信息修改模块、数据收集模块以及身份验证模块。用户模块的主要职责是处理与用户登录注册相关的各种操作。用户可以通过该APP进入其登录页面,但在正式登录前,他们需要先完成用户信息的注册,并输入相关的基础数据。APP的软件界面如图4.3展示,当用户完成注册并登录后,他们会在APP的主页面上看到数据采集的详细说明。数据的采集主要由数据的采集模块和数据录入两个部分组成。修改个人信息模块的核心任务是更改用户在注册时的基本资料。数据的处理模块主要完成数据采集与传输任务以及数据处理功能。数据采集模块的主要职责是实时收集参与者的步态信

44、息,并以csv格式进行数据存储,最后将这些数据上传至服务器,以便在PC端进行身份识别模型的后续训练。测试模块主要负责根据测试环境设置相应的参数来验证所设计的系统是否能正常运行,包括通过了哪些算法才能完成这些功能的测试等等。身份识别模块的主要职责是将经过训练的身份识别模型部署到移动手机上,以识别和显示受试者的身份信息。系统通过客户端和服务器之间的通信完成了上述功能的实现。此外,整个流程中的数据都被储存在MySQ1.数据库里,以方便身份验证模块的操作,整体的服务框架如图4.4展示。移动端软件图4.3APP软件界面图中(ft,j-1:JI4.2 身份识别模块的设计在本章的4.1节中,我们对本研究的系

45、统框架、开发背景以及移动端应用程序的各种功能和设计进行了简洁的阐述。上面提到的信息主要是为了设计身份识别模块而进行的前期准备,而这一节的重点是关于身份识别的具体实施方式,其总体结构如图4.5展示。用户俱恩乘电II数榭星象和情处理|蒯期BIl.你拿11.:KH.移动端安室APP_a图4.5身份识别框架图身份识别的框架图主要可以划分为两个核心部分:PC端的培训阶段和移动端的安卓App。在模型的训练过程中,我们首先利用智能手机的通加速度传感器和陀螺仪传感器收集了不同参与者的步态数据。随后,在PC端进行了一系列的预处理和特征值的提取。在此基础上,我们选择了性能表现出色的分类器模型进行实验对比,并对其参

46、数进行了优化。经过这些优化后的分类器模型被用于构建身份识别模型,并最终在移动设备上进行了部署。在移动端的安卓APP的识别过程中,当测试对象开始进行身份验证时,一方面,如果测试对象还未进行注册,并且之前也没有收集过步态相关的数据,那么他们需要先完成个人信息的填写,然后进入数据采集模块以获取基础步态信息。另一方面,若受试者已注册且有采集到相关信息,则可以直接通过服务器发送一个数据包给服务器。收集到的数据文件被上传到服务器NJUPT数据集的相应位置的数据集上,从而更新了相应的数据集。另一方面,当受试者已经完成了认证并通过测试之后,可以对其身份进行确认。根据已更新的数据集,需要对模型进行再次训练,并将

47、先前部署在移动设备上的模型更新为当前己经训练完成的新模型,以便进行身份识别。从另一个角度看,如果参与者已经完成了步态数据的注册,并且之前已经收集过步态信息,那么他们可以使用智能手机的内置传感器来直接收集当前行走状态下的步态数据,以便进行身份验证。在本文中提出了一种基于智能手机内置加速度传感器和三轴加速度计的人体运动行为识别方法。首先,考虑到手机放置的不同位置,我们需要统一相应坐标系中的数据位置,以方便后续的数据处理工作。为了实现这种坐标变换,需要将摄像头拍摄的图像转化为一个标准的二维空间坐标轴系。再者,考虑到收集到的原始数据存在噪音过大和数据长度不一致的问题,我们需要根据步态信号的特性,采用低通滤波方法对数据进行平滑处理。再次利用加速度作为人体运动状态判断依据,结合卡尔曼滤波算法估计出速度参数。最终,我们使用滑动窗口技术对加速度和陀螺仪的数据进行了区分,并从窗口中提取了加速度信号与陀螺仪信号的平均值、标准偏差、最大

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号