《CIDP15文化信息资源的检索.ppt》由会员分享,可在线阅读,更多相关《CIDP15文化信息资源的检索.ppt(54页珍藏版)》请在三一办公上搜索。
1、第15讲 文化信息资源的检索,时间:1月11日 14:0016:00地点:A306,文化产业管理专业文化信息资源开发规划课程,内容,计算机信息检索的原理文化信息资源数据库概况文化信息资源检索的过程,1.计算机信息检索的原理,计算机信息检索指利用计算机存储和检索信息。具体地说,就是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,继而再由终端设备显示或打印的过程。,1.计算机信息检索的原理,计算机信息检索包含两个内涵:存储过程:大量的数据按一定的格式输入到计算机中,经过计算机的加工处理,以一定的结构有序地存储在计算机的存储
2、介质上。查找过程:用户的需求输入到计算机中,由计算机对其进行处理,并与已存储在计算机中的信息进行查询与匹配,最后按要求的格式输出检索结果。,1.计算机信息检索的原理,计算机检索的本质是一个匹配的过程,即信息用户的需求和一定的信息集合的比较和选择的过程,换言之,也就是用户根据自己的需求提出的主题概念或提问表达式与一定信息系统的检索语言相适应的过程,如果两者相适应并取得一致,则所需信息就被检中,否则检索失败。,1.计算机信息检索的原理,1.计算机信息检索的原理,举例:【题名】信息检索技术在网络数据库中的应用研究【作者】邹小筑1 缪红梅2【机构】1南京大学信息管理系,南京210093 2南京航空航天
3、大学,南京210016【刊名】图书情报工作.2007,51(2).-104-106,131【ISSN号】0252-3116【关键词】信息检索技术 网络数据库 检索平台【文摘】以信息检索技术为脉络,结合Ei Village2、ISI Web of Knowledge、CSAIDS、EBSCOHost、ProQuestordjne等多个著名检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙词表构建技术在网络数据库的应用,研究表明信息检索技术已深深植入网络信息资源管理之中,深入剖析信息检索技术,可以清晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方法,为网络信息资源评价和建设提供依据。
4、,1.计算机信息检索的原理,计算机信息检索的特点:检索速度快,效益高;检索功能强,数量大;检索途径多,手段灵活;检索范围广;服务方式多。,1.计算机信息检索的原理,计算机信息检索技术:1 布尔逻辑运算符2 截词算符3 位置算符4 字段限制5 范围限制6.短语检索7.括号检索,1.计算机信息检索的原理,布尔逻辑运算:逻辑与:“*”或“and”,如:A*B 或 A and B逻辑或:“+”或“or”,如:A+B 或 A or B逻辑非:“-”或“not”,如:A-B 或 A not B,1.计算机信息检索的原理,“与”算符 and AND*“与”算符用于描述概念间的交叉关系和限定关系。含义:检出文
5、献中必须同时包含被其连接的所有词或词组。作用:缩小检索范围,提高查准率。例如:儿童*心理学 computer AND virus,1.计算机信息检索的原理,A,B,A and B,作用:缩小检索范围,提高检准率,computer,virus,与运算示意图,1.计算机信息检索的原理,“或”算符 or OR+“或”算符可描述概念间的并列关系和相关关系,用来组配同义词或相关词等。含义:检出文献中包含有被其连接的任意一个词或词组。作用:扩大检索范围,提高查全率。例如:自行车+脚踏车 CAD or computer aided design,1.计算机信息检索的原理,或运算示意图,B,A,A or B,
6、作用:扩大检索范围,提高检全率,pipe,tube,1.计算机信息检索的原理,“非”算符 not NOT-“非”算符用于描述概念间的排斥关系和特殊限定关系。含义:检出文献中必须包含这个算符前的词,必须不含这个算符后的词。作用:缩小检索范围,提高查准率。例如:水果 香蕉 Patent not German,1.计算机信息检索的原理,非运算示意图,B,A,A not B,作用:缩小检索范围,排除某一集合概念,German,Patent,1.计算机信息检索的原理,截词(?或*)将截词符加在检索词的前后或中间,以检索一组概念相关或同一词根的词。作用:扩大检索范围,提高文献的查全率。如:comput?c
7、omputer computers computing dam*dam dams wom?n woman women,1.计算机信息检索的原理,位置算符:又称为邻近度算符。一个检索式中词语的相对次序不同,其表达的检索意图 可能也不一样。位置算符的作用是对用作检索词的词组或短语中的各个单词之间的相对位置进行描述。常用的有(W)算符、(N)算符等。如steel(W)pipe 表示steel pipe 而不是 pipe steel又如 computer(1N)application 表示 computer application 或 application of computer,1.计算机信息检索
8、的原理,字段限制:指将检索词限定在特定的字段中进行。同样的检索词,选择在不同字段中进行检索,得到的结果是不同的。检索系统通常都会设置默认的检索字段,如“所有字段”。如果想指定在特定的字段中查找检索词,就需要调整检索字段,进行字段限制,1.计算机信息检索的原理,如果从文献的内容特征出发查找文献,可选的检索字段有“篇(题)名 title”、“关键词 keyword”、“文摘 abstract”以及“全文 fulltext”。一般如果使用相同的检索词分别在这几个字段中检索,那么检到的文献数会依次递增,而命中的准确率则依次递减。,检 全 率 递 增,检 准 率 递 增,题名 关键词(文摘)全文,命中3
9、1篇,命中80篇,1.计算机信息检索的原理,短语检索用“”表示,检索出与“”内容完全相同的短语,提高检索的精度和准确度。“international space station”,1.计算机信息检索的原理,括号检索用于改变运算的先后顺序,括号内的运算优先进行。(university or college)and education,2.文化信息资源数据库概况,概念 数据库是在计算机存贮设备上按一定方式存储的相互关联的数据集合。,2.文化信息资源数据库概况,数据库类型按内容和功能划分参考型数据库 以文档的形式组织起来,提供文献的题录、文摘等书目信息全文型数据库 存储文献全文或其中的主要部分的源数
10、据库事实型数据库 供查询某一客体的基本事实或简况,包括名录、传记等数据库数值型数据库 提供各类数值型数据多媒体数据库 以图形、图象为记录单位,2.文化信息资源数据库概况,2.文化信息资源数据库概况,2.文化信息资源数据库概况,2.文化信息资源数据库概况,2.文化信息资源数据库概况,数据库类型按收录专业范围划分综合性数据库 收录多个学科或专业的信息资料。如中国期刊网专业性数据库 收录单一学科或专业的信息资料。专题性数据库 收录某一特定专题的信息资料,2.文化信息资源数据库概况,2.文化信息资源数据库概况,2.文化信息资源数据库概况,2.文化信息资源数据库概况,字段:文献著录的基本单元,反映文献外
11、部特征和内容特征的每一项目,在数据库中就称为字段。如:题名、作者。如:关键词KW、题名TI、文摘AB、作者AU、刊名JN、出版时间PY、语种LA等;记录:由若干不同字段组成的文献单元,一条记录在数据库中代表一篇文献。数据库(文档)由若干数量的记录构成的数据的集合。大型的数据库检索系统中称为文档。,2.文化信息资源数据库概况,2.文化信息资源数据库概况,2.文化信息资源数据库概况,3.文化信息资源检索的过程,大体可分为六个步骤:分析课题的内容;选择信息资源库;构造检索式,选择检索途径;上机检索;分析检索结果,调整检索策略;,3.文化信息资源检索的过程,1.分析课题的内容 明确检索目的需要关于某一
12、课题的系统详尽的信息需要关于某一课题的最新信息了解一些片断信息,解决一些具体问题;,3.文化信息资源检索的过程,明确课题的主题或主要内容 要形成若干个既代表信息需求又有检索意义的主题概念,包括所涉及的主题概念有几个,哪些是主要的,哪些是次要的,概念之间关系如何等;课题涉及的学科范围:搞清楚课题所涉及的学科领域、是否跨学科研究所需信息的数量、语种、年代范围、类型等具体化指标,3.文化信息资源检索的过程,选择信息资源:是否与检索课题相关的资源都要检索选择哪些学科的信息资源选择哪些语种的信息资源信息资源覆盖的年限是否符合需求信息资源的特点及其针对性如何,3.文化信息资源检索的过程,构造检索式 选择检
13、索点检索式 是表达用户检索提问的逻辑表达式,由基于检索概念产生的检索词和各种组配算符构成。检索点 即检索途径或检索入口、检索字段。检索点正确与否,决定着检索结果的数量与质量。,3.文化信息资源检索的过程,进行检索可利用数据库提供的不同级别 的检索界面进行检索-初级检索-高级检索,3.文化信息资源检索的过程,分析检索结果 调整检索策略不滿意 非目标的结果检查检索名词的拼写 增加检索名詞的准确性 查阅工具如 词表,字典,分类表及字汇表,刪除错误的名词 审查被检索的数据库 查阅数据库的说明及期刊列表以确定是否覆盖你所要的主题,3.文化信息资源检索的过程,不滿意 结果太多增设限制条件至特定栏位及年代 增加检索名词的准确性-查阅工具如 词表,字典,分类表及字汇表 增加检索策略的准确性 增加使用 AND;减少使用 OR,3.文化信息资源检索的过程,不滿意 结果太少检查检索名词的拼写 增加检索名词的普遍性-查阅工具如 词表,字典,分类表及字汇表 扩大检索策略 减少使用ANDs;使用Ors连接同义词及相关词 增加被检索的数据库 确定其他数据库是否覆盖你所要的主题,3.文化信息资源检索的过程,满 意是否已全部获取所需?打印、电邮 或 存档需否获取与题录相关的全文?连接全文工具或使用全文服务,教学总结,笔记整理,Q&A,感谢您的关注!请您多多指导!,