一种问答式检索系统布尔查询生成方法.ppt

上传人:sccc 文档编号:5492286 上传时间:2023-07-13 格式:PPT 页数:15 大小:203.04KB
返回 下载 相关 举报
一种问答式检索系统布尔查询生成方法.ppt_第1页
第1页 / 共15页
一种问答式检索系统布尔查询生成方法.ppt_第2页
第2页 / 共15页
一种问答式检索系统布尔查询生成方法.ppt_第3页
第3页 / 共15页
一种问答式检索系统布尔查询生成方法.ppt_第4页
第4页 / 共15页
一种问答式检索系统布尔查询生成方法.ppt_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《一种问答式检索系统布尔查询生成方法.ppt》由会员分享,可在线阅读,更多相关《一种问答式检索系统布尔查询生成方法.ppt(15页珍藏版)》请在三一办公上搜索。

1、一种问答式检索系统布尔查询生成方法,何靖北京大学网络与分布式实验室2006.07,大纲,背景介绍信息检索(IR)和问答系统(QA)问答系统的模块查询生成方法研究调整式查询生成方法初始化查询查询调整实验设置和结果小结和展望,背景介绍IR v.s.QA,信息检索关键词查询文档集合信息需求关键词查询?文档集合所需信息?问答系统自然语言描述的信息需求精确的答案,背景介绍-问答系统模块,问题分析指代消解,问题分类,问题目标文档/段落检索文档检索模型查询生成检索排序答案抽取精细实体识别通过关系抽取模式匹配,背景介绍问答系统中查询生成,传统方法方法:问句出现词去停用词直接检索问题:查询过紧或过松导致查全率或

2、查准率的大幅下降基于模式重写对查询扩展方法:训练匹配模式,进行查询扩展问题:需要大量问题答案对数据,数据稀疏问题,调整式查询生成概要,目标提高检索效果:查准率和覆盖率提高检索效率:少的查询次数基本形式合取范式基本过程初始化查询查询调整,调整式查询生成-初始化查询,命名实体和专有名词(BASELINE)BASELINE+普通名词BASELINE+普通动词BASELINE+普通修饰成分,调整式查询生成-查询调整(1),设置合法区间检索获得文档数的范围:既不太多,也不太少查询过紧检索获得文档数低于合法区间范围,放松查询查询过松检索获得文档数高于合法区间范围,收紧查询,调整式查询生成查询调整(2),放

3、松查询策略添加扩展查询词扩展形式形态扩展语义扩展拆分词组删除关键词收紧查询策略增加关键词取消扩展形式,调整式查询生成算法,0.初始化查询,转入aa 若查询获得文档数在合法区间内,转入d。否则,若返回结果太多,转入b;太少,则转入c。b 如果没有关键词可以添加,转入d。否则添加idf最大的关键词(以及它的扩展,不添加不在任何文档中出现的关键词),如果返回结果太多,继续添加,否则删除刚才添加的关键词,加入idf次大关键词,一直到重复这样的添加删除到进入合法区间或者没有关键词可添加,转入d。c 如果有命名实体,则拆分命名实体。转入a。若没有命名实体,且没有关键词可以删除,则转入d。否则删除idf最小的关键词。删除后如果结果依然过少,继续删除,否则补回刚刚删除的关键词,删除idf次小的关键词,一直重复这样的删除补回一直到进入合法区间或者没有关键词可以删除。d 用产生的查询进行检索,获得结果。,实验设置,文档集:AQUAINT容量:3.1G文档数:1,033,461问题集:TREC2004/2005 QA TRACK Question TestSet,实验指标,实验结果初始化查询,实验结果调整查询,总结和展望,总结:模拟用户查询构造过程调整查询检索效率:2.5次调整大幅度增加检索效果(提高准确率、覆盖率和重复率)目前和今后的工作:合法区间的设置有选择的语义扩展统计学习获得检索词的特征,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号