中文网页褒贬态度的机器评价.ppt

上传人:牧羊曲112 文档编号:5909758 上传时间:2023-09-02 格式:PPT 页数:45 大小:302.50KB
返回 下载 相关 举报
中文网页褒贬态度的机器评价.ppt_第1页
第1页 / 共45页
中文网页褒贬态度的机器评价.ppt_第2页
第2页 / 共45页
中文网页褒贬态度的机器评价.ppt_第3页
第3页 / 共45页
中文网页褒贬态度的机器评价.ppt_第4页
第4页 / 共45页
中文网页褒贬态度的机器评价.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《中文网页褒贬态度的机器评价.ppt》由会员分享,可在线阅读,更多相关《中文网页褒贬态度的机器评价.ppt(45页珍藏版)》请在三一办公上搜索。

1、中文网页褒贬态度的机器评价,导师:俞士汶教授,孙斌副教授硕士毕业生:苏玉梅2004年5月硕士学位论文答辩,中文网页褒贬态度的机器评价,引言相关工作与工作基础网页褒贬态度评价模块实验结果及展望,引言,天网知名度系统网页观察机器评价视角下看中文网页类型项目延伸网页褒贬态度的机器评价本实验的研究内容及意义,天网知名度系统,基础:天网搜索引擎,计算语言学技术定位:用户定制查询,个性化网络检索服务数据:75万中文网页,近300个名人实体,注册实体信息库,引言,天网知名度系统网页观察机器评价视角下看中文网页类型项目延伸网页褒贬态度的机器评价本实验的研究内容及意义,网页观察机器评价视角下看中文网页类型,强文

2、字相关的信息类网页例如:个人简历型网页 弱文字相关的事件或事物展开型网页例如:事件报道,节目单,引言,天网知名度系统网页观察机器评价视角下看中文网页类型项目延伸网页褒贬态度的机器评价本实验的研究内容及意义,项目延伸网页褒贬态度的机器评价,网页是传递信息的。从效果上看,人们通过构建网页来传递信息,也可以进而表达态度和传递情感即,网页所包涵的褒贬态度信息。,网页褒贬评价关系分析图,引言,天网知名度系统网页观察机器评价视角下看中文网页类型项目延伸网页褒贬态度的机器评价本实验的研究内容及意义,本实验的研究内容及意义项目延续,符合天网知名度系统个性化网络服务的立意可以利用已有的数据基础和实验平台此项实验

3、具有研究和实验展开的可延续性,本实验的研究内容及意义语言基础,网络是重要的信息传播媒介。现实网页中的褒贬态度表达往往含有明确的目标、动机和效果期望,因此构造者会很重视语言知识这个交流手段。网页中的褒贬态度表达也就是一个典型的修辞行为,所以实验可以充分利用修辞学的理论成果,具有理论指导基础。,本实验的研究内容及意义创新价值,从语言学角度看,修辞涉及语言的附加意义,这区别于概念意义。因而此项实验具有丰富创新性研究价值。,中文网页褒贬态度的机器评价,引言相关工作与工作基础网页褒贬态度评价模块实验结果及展望,相关工作与工作基础,语言手段评价规范及标准资源准备系统基础,实验考察,实验考察,语言手段,词语

4、手段,句式手段,修辞手段,评价规范及标准,实验考察与实验资源的对应分布,相关工作与工作基础,语言手段评价规范及标准资源准备系统基础,资源准备,基础褒贬义词典 典型网页文本搜集 领域补充褒贬义词集 褒贬评价模板搜集,基础褒贬义词典,常用褒贬义词语详解词典 静态褒义、贬义词语,包括双音词,成语,惯用语,以及少数谦辞、敬辞。每个词条包括三部分内容:褒贬色彩,词性,释义,例句等;提示,重叠形式,同义解析等;近义,反义等。仅选取了每个条目中的两项信息,例如(诚挚)和(草率),生成了褒贬评价系统使用的褒贬义电子词典。,典型网页文本搜集,典型网页文本示例,领域补充褒贬义词集样例,褒贬评价模板搜集样例,相关工

5、作与工作基础,语言手段评价规范及标准资源准备系统基础,天网知名度系统,天网知名度系统模块浏览,用户界面模块 用户注册用户检索指定文本内容的评价主动推送服务网页分析与索引模块用户信息维护模块网页相关度评价模块,中文网页褒贬态度的机器评价,引言相关工作与工作基础网页褒贬态度评价模块实验结果及展望,网页褒贬态度评价模块,数据需求 设计思想 模块设计,数据需求,网页表示库,数据需求,实体信息库,设计思想,语言手段是基础话题的实体有关性针对领域标准的褒贬评价,注:网页褒贬评价流程图,褒贬结构要素,褒贬结构识别模板表达式,UAPUBPUCPUDPUAAPFPUACPGPUADPHPUPUPEC“和”|“与

6、”|“,”|“、”|“且”P=WCW2,关键结构P,p结构是褒贬结构的基本组成部分识别策略是:使得由链接词语链接在一起的词序列中不允许出现褒贬互逆,同时需要满足,仅当词语本身具有褒贬含义,或者W本身不在褒贬词典中但该序列中其他词语有褒贬含义,此时才形成合法的P,同时把未在褒贬词典中出现但出现在结构中的这个词语抽取出来,并依照此序列中的已有褒贬含义按照一致性原则猜测,把这个未登录词语纪录为未证褒贬词语。注:考虑到褒贬评价的领域性,这里的未证褒贬词语也是根据领域来分别记录的。,中文网页褒贬态度的机器评价,引言相关工作与工作基础网页褒贬态度评价模块实验结果及展望,实验结果及展望,成批网页褒贬评价结果

7、浏览http:/162.105.80.47指定内容褒贬评价浏览,结果浏览示例实体,结果浏览示例实体,改进方向,更精细的褒贬评价模板(内容、层次)转折结构及褒贬权重 更精确的褒贬冲突控制 褒贬评价的程度考虑 更精细的褒贬义词典构造,实验评价,修辞是有意识的行为,褒贬是有指向目标的态度,网络是当代生活的重要传媒手段。天网知名度系统立足发展个性化网络服务,因此其系统基础和系统数据资源恰好为褒贬态度的机器评价提供了合适的实验和检验平台。为合适的应用选择合适的处理方法,为合适的技术发现合适的应用领域,这种研究策略,在交叉领域是有效,更是饶有趣味的。,参考文献与资料,文献1【英】杰弗里N利奇语义学上海外语教育出版社2 史有为主编从语义信息到类型比较北京语言文化大学出版社3 陈汝东对外汉语修辞学广西教育出版社4 陈汝东认知修辞学广东教育出版社5 王逢鑫英汉比较语义学外文出版社6 亚里斯多德修辞学罗念生译,生活读书新知三连书店 1991年版7 张志公 张志公语文教育论集,人民教育出版社 1994年版资料1孙斌 中文信息提取系统设计与若干相关基础问题的研究 北京大学博士后研究工作报告 2002.52孙斌 天网知名度项目汇报 2002.11 3昝红英 天网知名度项目汇报系统结题报告 2003.12,致谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号