信息检索的基本步骤.ppt

上传人:小飞机 文档编号:5230022 上传时间:2023-06-16 格式:PPT 页数:20 大小:245.49KB
返回 下载 相关 举报
信息检索的基本步骤.ppt_第1页
第1页 / 共20页
信息检索的基本步骤.ppt_第2页
第2页 / 共20页
信息检索的基本步骤.ppt_第3页
第3页 / 共20页
信息检索的基本步骤.ppt_第4页
第4页 / 共20页
信息检索的基本步骤.ppt_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《信息检索的基本步骤.ppt》由会员分享,可在线阅读,更多相关《信息检索的基本步骤.ppt(20页珍藏版)》请在三一办公上搜索。

1、3-2 信息检索的基本步骤,1 信息检索的基本步骤:,(1)课题分析(2)选择检索系统(3)抽取检索词(4)构造检索式(5)文献检索及检索式的调整(6)检索结果的处理,第一步 分析课题,明确文献检索的目的;明确课题要解决的实质问题;明确有哪些主题概念;各主题概念之间的关系;明确课题涉及的学科范围;明确课题所需文献信息的语种、时间范围等具体要求。,富营养化、处理、湖泊,涉及生物学、环境科学等。,中文文献,近十年内发表文献,案例分析:,第二步 选择检索系统,选择检索工具时要考虑:专业性,即选择与学科专业相关的工具,特别注意跨学科领域内容。权威性,尽量选择该学科的权威性检索工具。了解检索工具收录的范

2、围,包括时间跨度、地理范围、文献语种、类型、揭示深度等。了解检索工具的检索方法和系统功能,中文检索系统可考虑CNKI、万方、维普数据库,外文数据库可考虑使用Science Direct、Springer、John Wiley、WOS等。,案例分析:,方法:切分、去除、替补注意:(1)准确、专业。检索词应该是能揭示课题主题内容的语词,不要将虚词和一些意义广泛的词作为检索词,如研究、探讨、思考等。(2)全面。考虑:a 基于概念的上下位词,如可再生能源与太阳能。b 同一检索词的不同表达方式,如白血病与血癌,Zn和锌,乙醇和酒精等。c 基于检索结果的同义词或近义词。,第三步 提炼检索词,富营养化、水华

3、、处理、治理、净化、修复、防治、湖泊、湖,案例分析:,检索式是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种组配算符构成。,组配算符通常有布尔逻辑算符、截词符(通配符)、位置算符、嵌套算符(优先算符)四种。,第四步 构造检索式,布尔逻辑组配运算是采用布尔代数中的逻辑“与”逻辑“或”、逻辑“非”等算符,将检索提问式转换成逻辑表达式,限定检索词在记录中必须存在的条件或不能出现的条件。凡符合布尔逻辑所规定的条件的文献,即为命中文献。,布尔逻辑算符组配检索,逻辑“或”,用符号“or”或“+”表示,其逻辑表达式为:A or B 或 A+B 其意义为检索记录中凡含有检索词

4、A或检索词B,或同时含有检索词A和B的,均为命中文献。,逻辑“与”,用符号“and”或“*”表示,其逻辑表达式为:A*B 或 A and B 其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。,逻辑“非”,用符号“not”或“-”,其逻辑表达式为:A not B 或 A-B 其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。,案例分析:,富营养化*(处理+治理+净化+修复+防治)*(湖泊+湖),水华*(处理+治理+净化+修复+防治),构造检索表达式注意事项:1 同义词或近义词之间用“逻辑或”组配 2 所有标点符号均在英文状态下输入。3 注意优先算符()的使

5、用。,选择合适的检索途径:题名途径(Title)责任者途径(Author)机构途径(Affiliation)序号途径(Code)分类途径(Classification)主题途径 关键词途径 其它途径,第五步 文献检索及检索式的调整,根据课题的已知条件和课题范围和检索效率要求,选择合适的检索途径。题名/关键词/摘要/主题/全文,一般来说,当检索结果不理想时,可以从以下几点考虑检索式的调整:(1)检索词是否准确?是否有同义词、近义词或其它隐含的词未被抽取。(2)检索式是否准确?是否有全角字符?组配算符是否正确合理?(3)检索途径是否合理?可考虑从不同的检索途径进行试检索,必要时用全文检索。,第六步

6、 检索结果的处理,检索结果的处理包括文献信息的选择、下载、存盘以及文献的阅读与引用。对于有参考价值、拟在论文写作过程参考或引用的文献,要逐篇下载,并将所有下载的文献信息按引文格式存盘,以便在论文的参考文献列表中使用。,2 检索效果的评价指标,检索效果(Retrieval Effectiveness)是指检索系统检索的有效程度,它反映了检索系统的能力。包括技术效果和经济效果。,克兰弗登(Cranfield)评价系统性能的指标:收录范围 查全率 查准率 响应时间 用户负担 输出形式,查全率 是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度。可用下式表示:,查准率它是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。可用下式表示:,查全率和查准率在一定程度上成反比关系。应根据具体课题的要求,合理调节查全率和查准率,保证检索效果。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号