《《自然语言处理》教学大纲.docx》由会员分享,可在线阅读,更多相关《《自然语言处理》教学大纲.docx(7页珍藏版)》请在三一办公上搜索。
1、自然语言处理教学大纲适用范困:2O2X版本科人才培养方案涕程代码:22150091课程性质:专业选修i果学分:2学分学时:32学时(理论24学时,上机8学时先修课程:人工智能导论、程序设计基础、人工智能程序设计、数据结构与算法分析等后蟆课程:人工智能拓展创新、人工智能综合创新、毕业设计适用专业:人工智能专业开课单位:智能工程学院一、课程说明自然语言处理是人工智能专业的一门专业选修课。自然语言处理是用计算机通过可计豫的方法时自然语言的各级语言单位进行转换、传输、存贮、分析等加工处理的科学,是一门计算机科学、人工智能以及语言学相岷系的交叉性学科,本课程介绍了自然语吉处理技术的基本原埋、实用方法和主
2、要应用,通过本课程的学习,使学生掌旌自然语吉(特别是中文语言)处理技术(特别是基干统计的谙吉处理技术的基本概念、基本原理和主要方法,了解当前国际国内谙=处理技术的发展概貌,接触谱言处理技术的前沿课题,具备运用基本原理和主要方法解决科研工作中出现的实际问题的能力。为学生开展相关领域(如网络信息处理、机器翻译、语音识别)的研究奠定堤础。二、课程目标辿过本课程的学习,使学生达到如下目标:课程目标1:熟练常握自然语言所需基本知识.对文本信息进行分析.邨程目标2:能蜂针对一个实际的人工智能应用问题.采用驾法从训练数据中提取特征.建立合理的学习模型.课程目标3:逐步培养学生应用计算机解决和处理实际问题的思
3、维方法与聪本能力,利用所掌握的知识能独立或合作制定有效的工程技术方案,进行简单系统的应用开发.课程目标4:帮助学生养成严谋的科研思维.树立追求真理,勇于探索的精神:提高其货任担当意识,泄造社会主义核心价值观,为更好的服务社会、建设国家贡帧力盘.课程目标5:培养学生树立正确科学的世界观、人生观和价猿观,坚定正确的政治方向.培养学生的法治观念、社会尚fE感和创新意识树立正确的审美观念和劳动观念.三、课程目标与毕业要求用白然语言处理*课程教学I1.标对人工智ffe专业毕业要求的支推见表1,1獴程教学目标与毕业要求关系毕业要求指标点课程目标支部M1.工程知识1.3德够将专业和数学等相关知识用于专业工程
4、同时的解决方案设计、比较和综合.课程目标h熟练掌握自然语言所需基本知识,对文本信息进行分析.M2.问J分析2.1能够招专业和数学等相关知识用于专业工程时时的解决方案设计、比较和综合。课程目标2:能够针对一个实际的人工智能应用问题,采用算法从训练数据中提取特征,建立合理的学习模型。M3.设计/开发解决方案3.2针对特定需求和约束条件设计人工智能及相关应用领域的系统集成、软件模块或算法流程.课程目标2:能鲂针对一个实际的人工智能应用问题,采用算法从训练数据中提取特征,建立合理的学习模型.M4研究1.2能够构建模拟或实验系统.通过伯息除合分析和实验结果解择,说明其有效性、合理性,得到解决方案实施施量
5、的合理有效结论。课程目标3:逐步培养学生应用计算机艇决和处理实际问题的思维方法与基本能力,利用所学覆的知识能独立或合作制定有效的工程技术方案,进行简单系统的应用开发。M注:表中-H(XXM(中了表示ii程与相关毕业要求的关联度四、教学内容,基本要求与学时分配1.理论部分理论部分的教学内容、基本要求与学时分配见表2。表2教学内容、基本要求与学时分配教学内容教学要求,敦学重点难点理论学时上机学时对应的课程目标1.绮论1.1自然语力处理微述1.2NP1.茶本流程1.3NP1.的开发环境思政1.由自然语言处理引申到自然界的各种语吉,引导学生有更广阔的世界观.教学要求:理解W1.的发展历程及研究内容、模
6、型的构建;牢记本课程出勤、作业和考核的要求.重点,理解W1.基本流程难点:M1开发环境搭建20I2增料库2.1语料库概述2.2语料库种类与原则教学要求:掌握语料库的构建原则:更深入地理解和掌握X1.TK模块及功能:能誉狭取语料库函数点I语科库的获取22I2.3 N1.TK库2.4 语料库的获取2.5 谱料库的构建与应用难点:语料库的构建及应用3.正则表达式3.1 正则友达式3.2正则表达式应用思政2:规则的应用扩展到我们社会的规则和秩序,正确的价值观.教学要求:理解正则表达式的元字符:学握正则表达式可以对指定的文本实现匹鼠测试、内容杳找、内容替换、字符串分割等功能,重点1match函数.Sea
7、rCh函数、finda11函数、SUb悟数的应用难点:正则表达式应用20I,中文分询技术1.1中文分词简介4.2基于规则的分词4.3基于统计的分词1.1中文分词工具jiCbH阵4.5中文分词的应用敦学要求i医于规则分词的思想和方法:室提基于统计的分词方法:常提中文分词工具jiebaj率分词的步骤及模式.点:分词的方法点,中文分词的应用6225.词性标注与命名实体识别5. 1词性标准5.2 命名实体识别5.3 中文命名实体识别思政3:词性标准规范,职业发展也褥要标准和规范,引导更正确的职业道彼观。教学要求,理解词性标注的定义.命名实体识别概念:掌握词性标准现范、Jieba词性标注、CRF模型的使
8、用方法:点:命名实体识别点:中文命名实体识别222&知河提取1.1 1关键词提取技术1.2 关犍词提取舞法1.3 自动提取文本关键词教学要求,理解关键词提取技术的概念:掌握关键词提取的算法;掌握自动提取文本关键词的方法。点,关犍词槌取的算法难点,编写算法自定义函数.并实现关世词提取2227.文本向公化7. 1文本向量化简介7.2文本离散表示7.3分布式表示7.4论文相似度计以教学要求,理解文本向量化的概念:掌握文本离散表示、分布式表示的方法.点:文本窗故表示、分布式衣示的方法难点:能计算论文的相似度2O3&文本分类与聚类8.1 文本挖掘荷介8.2 文本分类常用算法8.3 文木聚类常用算法8.1
9、文本分类与聚类的步骤教学要求,理解文本挖抠简介和挖提技术.皴娓文本分类常用算法和文本聚类常用算法:了解文本分类与聚类的步骤.点:文本分类常用W法和文本聚类常用算法点,文本分类常用算法和文本聚类常用算法1O39.文本情愿分析9.1情感分析简介9.2情憎分析的常用方法思政4:人类情。很复杂,要学会调整情绪,保持乐观枳极向上的情绪.帙学要求:理就情盘分析同介、主要内容,掌擢情感分析的常见应用、基于情感词典的方法.重点:基于1.DA模型的方法难点t基于U)A模型的方法2O3合计2482.上机部分上机部分的教学内容、基本要求与学时分配见表3。表3上机项目、上机内容与学时上机事目上机内容和要求上机学时对应
10、的课程目标1.语料库的构建上机内容:构建语料库:N1.TK梗块库:N1.TK座的安袋使用及诏料库获取的方法,并对语料文本诳行分析。上机要求,熟悉并掌握N1.TK数据包的安装步骡、函数的调用、语料库的获取.212,中文分词技术上机内容;基于规则的分诃方法、基于统计的分词方法以及使用jieba进行分词:。上机聂求,使用Python实现逆向最大风配法分词:使用Python实现基于IMM的分词:通过jieba库完成Si频词提取.223.词性标注与命Z实体识别上机内容,词性标注和翦于条件随8版的命名实体识别.上机要求:利用条件的机场对命名实体识别.221.关键词提取上机内容:美健词提取技术的3种算法.上
11、机要求,根据3种关键词提取算法原理,编n林种徵法自定义函数,并通过实例实现关城诃提取.238五、教学方法及手段课程教学以课堂讲授为主,结合实验、作业、慕深、雨课堂资源,鼠合多媒体课件等共同课完成堂授课内容.来钉钉、学习通、QQ、修信等交流工具,加强和学生之间的交流和沟通.六、课程资源1 .推荐效材,作者(译者)书名.出版社.出版时间.1肖刚,张良均.Py1.hon中文自然语宫处珅基础与实战.人民邮电出版社,202k2,弁考书,作者(评者).书名.出版社.出版时间.(II何,.自然语言处理入门.人民邮电出版社,2019.2关留布像莱恩,科尔提华德,汉纳斯马克斯哈普克.自然语言处理实战.人民邮电出
12、版社.2020.3涂铭.PyIhOn自然语言处理实战:核心技术与算法.机械工业出版社,2018.4 Bishop.C.M.PatternRecognitionandMachine1.earning.SpringScience+BuSineSSMedia.1.1.C,2006,3 .期刊:作者.文题.刊名,年,卷号(期号).或者:刊名,主办单位II吴凡,李松涛,目书悦,赵酹.人工智能自然语古处理在阿尔茨海默病中的应用【4.童庆医科大学学报2021T1T7.12)周小评张梓,藏文娟.基干神经网络机器翻译的自然谱言信息隐藏叫,计算机科学.2021.48(S2).3艾山汪买尔,买合木提买买提.汪烈军.
13、基于人工智能技术的“自然语言处理”课程教学模式改革与探索IJ1.无战互联科技,2020.17(10:92-94.4仲茂生,黄晓辉,张红就.“向Sfi引导项目驱动”并举的自然语言处理课程教学改革实践J计算机教行,2018(6):72-75.(5J傅迎华.季江.付东翔.自然语音处理课程教学探索和实践计算机教育,2018(4):56-59.6WENJ、ZHOUX.ZHONGRc1.a1.Convo1.utiona1.Neura1.NciworkBasedTextSteganaIysisIJ.IEEESigna1.Processing1.etters,2019,PP:1-1.4 .网络资1.网站名,访
14、问路径ht1.p1.space.bi1.ibi1.i.conv,147()99447ron=seatxhcid=10515923(M2889975838&spinidfnm=333.337.O.Ohtpce.bi1.ibi1.i.conVI47099447frwcatrh1.eid1.()51.5923042889975838spnim=333,337O0七、课程考核对课程目标的支撑课程成绩由过程性考核成绩和期末考核成绩两部分构成,具体考核/评价细则及时课程目标的支控关系见表1.表4课程考核对黑程目标的支撑考核环节占比考核/阳JHejH修程目标12310根据课堂出勤情况和课堂【可答问遨情况进行
15、考核,满分100分。2以平时考核或绩乘以其在总评成绩中所占的比例泞入课程总评成绩。442实验20D根捌每次实险的实验操作完成情况和实验报告防属总独评分,满分100分:2)每次实脸单独评分取各次实验成绩的平均(ft作为此环节的最终成绩.3以实验成绩媒以其在总评成绩中所占的比例计入课程总评成绩,15作业101主要考核学生对各章节知识点的狂习、埋解和掌握程度,满分10。分:徒次作业单独评分,取各次成绩的平均值作为此环节的最终成绩.以作业成绩乘以其在总评成绩中所占的比例计入课程总部成绩.663期末考核601期末考核以课程大作业的方式提交.大作业卷面成绩100分,以卷面成绩乘以其在总邯成绩中所占的比例计
16、入课程总评成缢.(2)主要考核学生运用自然语言处理对实际向题的淙合分析的能力。大作业题型为:粽合分析题252510合计:100分355015八、考核与成绩评定1 .考核方式及成绩评定考核方式:本课程主要以课堂表现、实验、作业、期末大作业等方式对学生进行考核评价.考核基本要求:考核总成绩由期末大作业和过程性考核成绩组成.其中:期末大作业成绩为100分(权重60%),大作业类型为标台分析题:课堂表现、实舱、作业等过程性考核成绩为100分(权重40%);过程性考核和考试试题分值分配应与教学大纲各常节的学时培本成比例,2 .过程性考核成炭的标准过程性考核方式Ifi点考核内容、评价标准、所占比重见表5.
17、5过程性考核方式评价标准考核方式所占比(1)100x9090x8080x7070x60x6025积极参与教学活动,踊班问答问时.准确率大于90认真参与;活4I可答问SS准确率大于80%。偶尔参与敦学活动,网答问SS准确率大于70%,上课不认真,偶尔参与教学活动.上课不认翼、不参与教学活动.实殴50实脸原理清晰、绘图规范,实验株作过程熟练、规范、正确,数据处理及讨论正确.实险原理较清晰、绘图较规范.实验操作过程较熟练、规范、正确.数据处理及时论较正确.实脸原理地本清晰、绘图基本规范,实验操作过程基本熟练、能完成基本操作,数据处理及讨论基木正确。实脸原理不够清晰、绘图不够现冠,需在指导下完成基本操
18、作,数据处理及讨论不修正确.无实验报告,实验操作步骤有误,数据处理及讨论有误。作业25作业完整,思路清晰,准确率大于90.字迹工整.作业完整,准确率大于80%.字逸工整.不交作业2次以内,准确率大于70%.不交作业4次以内,准确率大于60%.不交作业5次以上,准瑜率小于6佻“3.大作业诱分标准优秀(90T00分):具有完整的程序界面和程序功能,程序中具有复杂的数据结构:设计者不仅完成了规定的任务,而F1.实现的功能具有创新思路。技术文档完善、全面.排版清晰、简洁,具有很好的开发文档写作能力.良好(80-89分):具有完整的程序界面和程序功能,程序中具有复杂的数据结构:设计者不仅完成了规定的任务,而且实现的功能更多,具有扩展特点.技术文档完善、全面,排版清晰、荷洁,具有很好的开发文档写作能力。中等(70-79分):能够基本实现程序功能,程序运行正常无大错:设计者能矮基本完成规定的任务.技术文档完善、全面;及恪(60-69分):能锈掂本实现程序功能,程序运行出现个别错误:设计者能够基本完成规定的任务。具有暴本的技术文档:不及格(59分及以下):基本不能实现规定的程序功能,没有基本的技术文档,