《知识工程研究所科研成果综述.ppt》由会员分享,可在线阅读,更多相关《知识工程研究所科研成果综述.ppt(68页珍藏版)》请在三一办公上搜索。
1、知识工程研究所科研成果综述,北京科技大学信息工程学院知识工程研究所http:/,综述内容,研究所简介所长简介主要学术成果国家发明专利主要软件产品(ICCKDSS)介绍主要应用成果介绍,一.研究所简介,北京科技大学知识工程研究所成立于 2001年3月,由博士生导师杨炳儒教授任所长。本所在知识表示(语言场理论)、推理机制与知识发现、智能系统、柔性建模、集成技术等理论与技术研究方面取得了突破性的成果,开拓了基于内在机理研究的知识发现新方向。在理论研究基础上,本所建立了多个研究基地与协作基地,大力推广、应用研究所的研究成果。本所培养出了1名博士后、52名博士、百余名硕士、7名外国留学生。现有博士生16
2、人,硕士生30余人。研究所主要成员:谢永红博士,张桃红博士,联系方式:北京科技大学 信息工程学院 知识工程研究所(100083);手机:;E-;研究所主页:http:/,二.所长简介,杨炳儒教授 北京科技大学信息工程学院首席一级、资深教授、博士生导师、知识工程研究所所长。历任计算机系副主任,信息工程学院副院长。享受国务院特殊津贴的有突出贡献的专家;国际注册科技专家。兼任国家科技基础条件平台建设专家顾问组专家、教育部学位中心评审专家、中国教育专家委员会专家、国家863高新技术项目、国家自然科学基金项目、教育部科技项目及国内外几个著名刊物的评审专家。任国际一般系统学会中国模糊信息与模糊工程学会名誉
3、理事长、中国人工智能学会离散数学专委会主任与知识工程专委会副主任等。,曾任英国剑桥CIT高级督察官,国家教委考试中心NIT专家组成员,香港专利事务所高级顾问。受聘于多个大学任讲座教授或兼职教授。曾十余次出国出境参加国际学术会议(多次担任国际会议程序委员会委员与分会主席)、讲学与合作研究。获两次国际重要奖励(“成就奖”与“杰出成就奖”-国际上两次获奖者12人)是国内较早进入知识发现领域的学者,具国内外的高知名度。杨教授被多家重要媒体以“著名信息工程专家”、“中国著名计算机科学家、知识发现专家”、“中国当代大师”为题作了报道。,科研方面:在国内外发表学术论文近450篇;经查新被SCI、EI、IST
4、P收录共155篇,论文共被引用411次,WOS引用:有21篇被引用51次(注:该研究领域至今才有不到20年的发展历史),相关论文已被“REPRODUCTION IN DOMESTIC ANIMALS”、“JOURNAL OF FOOD SAFETY”等重要国际刊物引用。出版著作15部(独专著8部-其一为英文在美国出版,合编著7部),其中国内第一本关于知识发现的专著知识工程与知识发现已被引用231次。通过国家与省部级正式鉴定或验收的科研课题共30余项,在研课题5项(均为课题负责人)。独获国际重要科技奖励2项(有评价书)、获位于第一名的国内省部级科学技术奖励8项。以唯一发明人获4项国家发明专利证书
5、(另通过实审4项,受理2项)、1项计算机软件著作权登记证书和1项软件产品证书。,教学方面:讲授12门课程,全部脱书脱稿,多次观摩教学,力求教学的科学性与艺术性,长期博得听课师生的一致赞誉。提出“知识逻辑结构核心论教学观”、“知识逻辑结构与思维导图融合教学法”。获教学研究成果奖多项;发表教学改革的论文;承担国家教改项目;独编与主编多部教材;曾在中央电视台与天津电视台讲授价值工程,获奖与好评。先后培养与指导青年教师2名、博士后1名、博士生67名、硕士生 73名、外国留学生7名。鉴于上述主要成就与贡献,曾被载入世界数学家名录、世界名人录、世界科技咨询专家、世界优秀人才名录、中华当代大师;“科技日报”
6、、“人民画报”、“中国画报”、“新华社”、“中国科学院”、“科学中国人”等以“著名信息工程专家”、“著名计算机科学家、知识发现专家”等为题做了报道;天津电视台也曾用中英文向国内外做过相关报道。,三.主要学术成果,一、知识发现与智能系统方向1、在国际知识发现领域率先提出基于内在认知机理的知识发现理论体系KDTICM,1)4个先导性的系统框架(纵向研究):把知识发现系统(过程)视为认知系统(过程),用系统论与认知科学的方法来研究其复杂进程,相继发现了四个机制(每个机制里都含有核心定理及其技术实现方法,揭示其潜在本质与规律性)并沿机理-模型-算法线路构造了四个知识发现系统框架:框架一:以认知心理学为
7、基础,发现双库协同机制(结构对应定理);并由此诱导出新型过程模型KDD*;进而由机理与模型的研究派生出了新型挖掘关联规则的M算法.框架二:以协同理论为基础,发现双基融合机制(过程模型逻辑等价定理);并由此诱导出新型过程模型KDK*;进而由机理与模型的研究派生出了新型KDK相关算法.,框架三:以认知物理学为基础,发现信息扩张机制(动态进程参数演化定理);并由此诱导出新型复杂类型数据挖掘过程模型DFSSM;进而由机理与模型的研究派生出了新型文本分类、文本聚类挖掘算法以及基于新信息熵公式的SID3挖掘算法等.框架四:以认知生物学为基础,发现免疫进化机制(协同定理),并由此诱导出新型基于免疫进化机制的
8、知识发现结构模型;进而由机理与模型的研究派生出了新型基于免疫进化机制的时序模式发掘算法、粗糙集分类规则挖掘算法以及基于免疫进化机制的聚类挖掘算法.,2)由系统框架到理论体系KDTICM的构建(横向研究):共经历了十余年时间,先对四个系统框架进行整合集成、交叉融合;在此过程中又形成了若干新的过程模型和算法,如:过程模型KD(D以多关系频繁模式发现研究、基于超图的链接挖掘方法研究和多关系朴素贝叶斯分类研究为主要研究内容,先后构造了MRFPDA算法、MLMFPD算法等。最终建立由理论基础、4个机制(理论支柱)、8个新过程模型、17种新技术方法组成的基于内在认知机理的知识发现理论KDTICM.,3)K
9、DTICM与传统的实用智能系统交叉融合,构造了4类新型实用智能系统:基于知识发现的专家系统(ESKD)基于知识发现的智能决策支持系统(IDSSKD)基于知识发现的智能预测支持系统(IFSSKD)基于知识发现的计算机辅助创新智能系统(CAIISKD).从根本上改善了“知识获取”与“知识贫乏”的瓶颈问题,提高了经典实用智能系统的结构、功能与智能化程度.,4)KDTICM的技术实现(载体)-具有自主知识产权的大型集成化组合构件式知识发现软件系统ICCKDSS(1.0版).ICCKDSS采用了C/S与B/S相结合的方式开发而成,并配有相应的文档和软件说明书.该系统已通过中国软件评测中心的正式检测,获软
10、件著作权登记证书与软件产品证书.,5)KDTICM的应用:KDTICM及其衍生的新型智能系统成功地应用于农业、生物信息学、中医、现代远程教育网、气象、国际商务、铝电解生产、税务、数字资源整合等领域。在国内外“数据挖掘技术仅在商业的软决策上成功应用,而在工业等领域难获硬效益”的现实面前,后三个领域取得较为显著的直接经济效益;已在6个单位具体实施推广应用;分别与国内外13个公司签定了销售与研发协议;曾与美国Zaptron公司与德国柏林洪堡大学合作研发.,2、在国际知识发现领域开辟了基于知识库的知识发现(KDK)新方向这是至今在国内外尚待开拓的专题.早在2003年就正式提出KDK:即针对知识库里的事
11、实,采用归纳学习方法产生归纳假设,再用卡尔纳普的归纳逻辑进行假设的验证与评价;针对知识库里的规则,采用广义概念格方法产生归纳假设,再用柯恩的归纳逻辑进行假设的验证与评价;现得国家自然科学基金资助,开展高阶逻辑背景下的研究;已在国内外主流刊物上发表多篇有影响的论文,吸引了相关学者开展此项研究。,3、在国际知识发现领域首次总结与提出当今面临的5类重大问题领域进展中的两大核心问题(“基础理论的匮乏”和“缺少杀手锏式的应用”)两大猜想问题主流发展中富有挑战性的问题应用研究中的相关领域重大问题领域技术标准的制定问题 并对这五类问题的意义或部分解决方案进行了深入探讨.特别是为解决数据挖掘中因“海量数据”而
12、造成的时空与计算复杂性这一难题,我们提出了旨在化海量为有限量的“逆问题猜想”和“磁铁效应猜想”,并实现了部分解决方案.,4、生物信息学领域中国际性难题-蛋白质二级结构预测研究取得突破国际性难题:基于计算机程序的蛋白质3维结构预测中二级结构预测研究已经有30多年的历史,其主流发展是各种不同预测方法的研究;然而长期以来,蛋白质二级结构预测研究进展缓慢;同时当前出现了绕过二级,直接由一级预测三级的趋势,但精度均不理想。故蛋白质二级结构预测研究已成为本世纪分子生物学和生物信息学领域中公认的国际性难题。原始创新性:我们没有步国际主流发展的仅研究预测方法的后尘,而是作为预测系统加以研究,它涵盖了系统模型、
13、系统方法、系统优化等核心构件。,预测结果:在ILP相应的数据库Q3精度达93.88%(国际最高达81%);在RS126数据库Q3精度达84.1%(国际最高达81.65%);在CB513数据库Q3精度达80.49%(国际最高达78.44%).均处国际领先水平.商业前景:1)利用基因技术改良天然蛋白质序列和结构,得到新的蛋白质,以用于工业、农业、医药卫生等领域;2)蛋白质立体结构是进行生物制药的先决条件;3)可产生效益的模式有:建立蛋白质立体结构资料库;建立单核苷多态基因的特殊资料库。展望:二级继延伸,扩展至三级,参国际竞赛(2010年).进而深入到功能预测与转化工作.,二、柔性建模与集成技术方向
14、1.提出用于智能控制与智能管理的新模型、新技术与新方法。如:泛布尔代数与多层次结构逻辑、因果关系定性推理模型与广义细胞自动机模型、专家知识的归纳获取机制、基于模糊语言场的模糊集成技术、模糊语言优化模型等;解决了先前未解或难解的四个重要问题:1)正交试验的逻辑基础分析;2)一类基于定性推理的多变量(参数)协调控制模型;3)大系统功能分析的层次结构方法与模糊语言优化集成技术;4)基于模糊语言场的生产装置危险等级评定的集成技术.2.将创新性模型与技法应用于智能控制、价值工程、安全系统工程等领域。参与19911993年全国性的重大现代化管理项目-价值工程,主讲价值工程(中央与天津电视台)获奖;深入十几
15、家大中企业进行推广应用,获显著的经济效益与社会效益.,四.国家发明专利,专利1 一种基于双库协同机制的 KDD*的方法及系统专利2 一种基于信息挖掘的智能决策支持构造方法专利3 一种WEB挖掘系统的构造方法专利4 组合型智能化家用空调器的控制方法与装置专利5 一种融入R型协调器的KDK系统(已通过实审)专利6 一种融入R型与S型协调器的KDK系统(已通过实审)专利7 一种基于双基融合机制的的KDK*系统(已通过实审)专利8 基于知识发现的专家系统构造方法(已通过实审)专利9 一种蛋白质二级结构智能预测模型(已受理)专利10 一种基于KDD*模型的蛋白质结构预测方法(KAAPRO)(已受理),五
16、.主要软件产品(ICCKDSS)介绍,主要构件:基于数据库的知识发现系统KDD*SSWeb文本挖掘Web用户访问模式挖掘 智能搜索引擎理论基础:KDTICM专利支持:一种基于双库协同机制的 KDD*的方法及系统一种WEB挖掘系统的构造方法,基于数据库的知识发现系统KDD*SS,KDD*SS界面,KDD*SS界面,KDD*SS特征,KDD*SS有机地沟通与融合了KDD*SS新发现的知识与基础知识库中固有的知识,使它们成为一个有机的整体;即实现了“用户的先验知识与先前发现的知识可以耦合到发现过程中”,在结构与功能上形成了相对于KDDSS而言的一个开放的、优化的扩体。在知识发现过程中,KDD*SS对
17、于冗余性的、重复性的、不相容的信息作出了实时处理,有效地减少了由于过程积累而造成的问题的复杂性,同时为新旧知识的融合与合成提供了先决条件;实现了“知识与数据库同步进化”。KDD*SS改变与优化了知识发现的过程与运行机制,实现了“多源头”聚焦与减少评价量。,从认知科学的角度看,KDD*SS强化并提供了知识发现的智能化程度,提高了认知自主性(这将是今后相当长的一阶段内保持的研究基调),较有效地克服领域专家的自身局限性,实现了“采用领域知识辅助初始发现的聚焦”。作为KDD*SS的核心技术双库协同机制的研究,揭示了在一定的建库原则下,知识子库与数据子类结构之间的对应关系,为实现“限制性的搜索”而减小搜
18、索空间、提高发掘效率提供了有效的技术方法。KDD*SS采用了全新的离散化方法基于语言场理论的连续属性离散化算法DCL。KDD*SS实现了一种优于Apriori算法的基于双库协同机制的关联规则挖掘算法Maradbcm算法。KDD*SS采用了一类新型的知识自动评价系统。,KDD*SS的知识库是SQL Server。原数据库和知识库的连接全部是动态连接,用户可以根据需要连接不同的数据源;KDD*SS支持多种数据库,因此待挖掘的原数据库可以是不同的数据库,如:Oracle,DB2,SQL Server,Access和其他ODBC兼容的关系数据库等;在KDD*SS中我们注意知识的展示功能,以比较直观的方
19、式把挖掘出来的知识展示给用户,并用多种方法来表示知识,如:用圆和线来表示各种属性之间的关系,用饼图的形式化的图形来表示知识的可信度,用户可以根据挖掘出的知识进行各种决策工作;KDD*SS使用比较方便,用户大部分工作都是使用鼠标来完成的;同时界面非常友好,由于大部分用户是Windows用户,我们的现实风格基本和Windows的风格一致;KDD*SS的最大的特点是具有良好的通用性与可扩展性,应用范围广;与用户数据接口简单,不需建立数据仓库。,同类对比(与目前市场上流行的数据挖掘软件Clementine在关联规则挖掘对比),在执行速度上,Clementine存在一定优势,但其优势是以牺牲被发现规则的
20、数量为代价。KDD*的离散化过程更加直观,简单;KDD*具有知识库维护功能,使得对被挖掘知识的后期管理、维护更加方便;KDD*一次挖掘的规则数量更多,获得知识更加丰富。在KDD*的支持度的定义下,KDD*所取得的有益规则,较Clementine取得的有益规则,存在更多支持度小,可信度高的规则,即意外规则。这些规则往往对预测结果起到重要作用。KDD*的支持度定义,使得规则适用度较高,更好地防止了“过渡学习”,预测模型的鲁棒性较强。KDD*具有更好的扩展性,实验室的活跃思想,可以使其功能更加完善。,Web文本挖掘,特征的建立,特征集的缩减,学习与知识模式的提取,知识模式,模型质量的评价,文档集,W
21、eb文本挖掘系统流程图,Web文本挖掘界面,Web文本挖掘结果展示,Web用户访问模式挖掘,系统的输入数据有:服务器日志(访问日志、引用日志和代理日志)、Web站点的结构文件、以及可选的与具体站点相关的数据,如:用户注册信息库、电子商务或银行数据等。系统的输出为:经过模式分析得到的感兴趣的规则和模式,并以友好、直观、形象的界面展示给用户。,频繁访问页面统计,频繁访问路径,智能搜索引擎,搜索概要结构界面,搜索详细结果界面,六.主要应用成果介绍,用多年时间组织实施了上述KDD创新性理论及技术方法在农业、铝电解生产、数字资源整合、税务、现代远程教育网、气象、国际商务、中医、生物信息学等领域的应用.在
22、此重点介绍:远程教育农业气象铝电解生产税务国际商务数据资源整合中医蛋白质二级结构预测(从略),远程教育,项目背景:教育部重点科技项目:“远程教育网关键技术信息挖掘和智能搜索工具的研究”(教技司2000175)2001年1月开始,经过两年的努力,将KDTICM、ICCKDSS成功地应用到远程教育网关键技术信息挖掘和智能搜索工具中.分别于2002年4月和2002年10月在北京龙腾创想科技有限公司(该公司主要进行远程教育网络集成和开发,具有完善的远程教育平台)和兰州大学网络通信中心(该中心已在甘肃省建立了2个多媒体授课中心、13个多媒体听课中心、和异步局域网教室,为实施现代远程教育提供了必要条件)通
23、过了相关软件工具的测试和实际运行.,评价:兰州大学网络教育学院的教师们反映:有了Web日志挖掘系统,教师可以了解和分析学生们的兴趣之所在,并有针对性的制定教学策略,作到因材施教.学员们也认为,他们通过智能搜索引擎找出了大量与自己感兴趣的问题相关的网页;通过使用Web文本挖掘系统针对某一十分感兴趣的主题进行更为详细的分类和聚类,学习的积极性极大地提高了.用户测试运行分析结论为:”ICCKDSS与同类软件产品相比:在理论上,具有很大的创新性;在应用上,具有很好的验证理论的价值与实用价值;在测试效果上,具有良好的标准化的测试指标.通过比较分析后认为该软件系统和好地解决了现代远程教育网所面临的信息转换
24、、提炼等重大问题,是基于原创性理论的具有自主知识产权的软件系统,系统整体上已达到了国内领先、国际先进的水平,并具有广泛的应用前景.”,农业应用,项目背景:国家自然科学基金重点项目“基于数据库与知识库的知识发现及其农业应用系统的研究”(项目编号:69835001)从1999年1月开始至2002年12月,经过四年的努力,我们以安徽省合肥农业示范区为基地,开发出了面向施肥的农业知识发现专家系统(KDIST-SF)和面向植保的农业知识发现专家系统(KDIST-ZB),将KDTICM与ICCKDSS成功地应用于施肥、植保及防治病虫害等农业具体领域.,农业应用,解决的典型问题:通过使用ICCKDSS对合肥
25、市相关的农业数据进行挖掘,我们发现:水稻干物质累积和对硒的累积不同步,前者高峰在生长中期,后者以生长后期为主;另外水稻对硒有一定的生物富集作用.将这些规则存于知识库后,根据这些规则,在农艺措施上应在稻灌浆充实前增施一次硒肥,而在缺硒和低硒地区施用硒肥,能显著提高水稻含硒量,改善其营养品质,提高其市场竞争力.这样一方面可以指导人们合理地施加肥料,另一方面也可以指导肥料生产厂家在不同阶段添加不同的微量元素,以适应农业生产的需要.根据我国某地区二十年来的小麦苗情资料和气象信息,我们发现了节气、降水、日照、苗高、苗数等之间的关系,从而有助于对农作物田间管理、施肥、施药等进行有针对性的科学指导.,农业应
26、用,气象,项目背景:国家气象局”大城市环境气象信息系统研究”课题的子课题“气象数据挖掘与知识发现软件系统”2000年1月开始至2002年12月,将ICCKDSS应用于气象短期预报与服务领域.评价:通过在北京气象科学研究所进行实际运行后,认为:该软件性能良好,使用方便,人机界面友好,通过在气象各个部门中的推广应用,可产生很大的经济效益和社会价值,是一个具有很高技术含量的软件系统.,解决的典型问题:在气象云图处理上,过去采用经验的方法或传统处理方法,而我们采用相似模式的挖掘方法来分析气象云图,并给出基于信息挖掘的短期预测模型.项目进展:ICCKDSS已作为关键部分应用于北京市气象局的“大城市气象预
27、报服务信息系统平台”.ICCKDSS的应用,不仅有效地起到了辅助短期气象预报的功能,而且可实现在不同的天气生成不同的产品和服务,并将有用的存入知识库,极大地丰富了北京市气象局的服务范围和功能.,铝电解生产,项目背景:本项目是针对我国铝电解企业在生产过程中对电解槽的控制上主要采用是人工经验的方法,而非智能化控制。在实际生产过程中往往是通过有经验的工人来确定电解铝生产的各项运行指标,这样的人工经验方法不可避免造成电解铝行业的能源损耗以及生产效率低下。青铜峡铝业集团有限公司建成投产的350kA大型预焙铝电解槽生产系列,是我国目前为止电流最大的铝电解生产线;2004年初投产后,由于系统的复杂性,难于找
28、到最佳的工艺技术参数,生产不稳定,无法按期达产、达标.该项目获北京市科技发明三等奖相关专利:基于知识发现的专家系统构造方法,铝电解生产,研究成果新的数据挖掘(知识发现)技术的融入,在固有模糊控制与模糊专家系统基础上引入数据挖掘技术。通过对青铜峡铝业集团公司电解350系列的生产数据进行分析,发现了潜在的人所未知的电解工艺规律;通过调整工艺参数,提高了电流效率,降低了能耗。以青铜峡铝业集团有限公司350kA预焙铝电解槽(共290台)一年28万产能计算,提高电流效率0.8%,降低直流电耗120kWh/t-Al,每年带来的直接经济效益达1050万元。2005年中国电解铝的产能为800万吨,若全面推广应
29、用此项技术,其直接年经济效益为800/28*1050=30000万元(3个亿)。,铝电解生产,铝电解生产,税务,项目背景:目前,税务局的IT现有架构已具备了较为成功的业务处理层和初步的信息管理层,信息的搜集和积累已经相当成熟,但决策支持层还有所欠缺,这种状况急待改变.应考虑尽快建立一个以数据挖掘为主线的系统,且该系统应具备下述特征:1)有助于税务局宏观掌控辖区内税收变化动态及趋势,提高决策的洞察力和政策制定时的针对性;2)有助于税务局各业务处室,如征管,稽查,计会制定部门策略,提高监管力度,增强监管效果;3)有较好的先进性、前瞻性和扩展能力,为税务局带来显著的持续的竞争优势.与北京市西城区地税
30、局合作,建立了一套以以上数据挖掘创新模型与技法为核心的系统,较好的解决了若干重要问题.,研究成果最初在北京市西城区地税局应用,通过与地税工作人员的长期合作交流,尽量把这套系统与实际业务向结合,做到实实在在地为实际工作服务,其间对这套分析体系也进行逐渐完善.该项目在西城地税取得了令人满意的成果,得到了客户方的认可,并已在实际中应用,而这正是我们所追求的结果.已有北京市地税局(亦庄开发区地税局、西城区地税局),北京市财政局使用了我们的软件系统,累计销售额为360万.同时,以西城区税务局为代表,通过该系统的使用,筛选出的重点企业一一整治排查,直接为国家增加税收300多万;其中房地产行业增加115万,
31、金融行业增加190万.该应用现正在税务系统全面实施中,可达直接经济效益5000多万.,国际商务,项目背景:在与国家商务部国际电子商务中心的合作中,构造了基于我们专利技术的”面向加工贸易基于竞争情报的智能决策支持系统”.针对外贸加工中国内采购与供应链系统进行深入分析;通过数据挖掘、WEB挖掘、案例推理与OLAP等技术,发现规律,辅助决策.此项目研发的新型智能决策支持系统是集理论、软件与应用于一体的创新性研究成果;深刻地体现了知识发现创新技术与前沿智能技术的融合,在解决国家对外商务领域辅助决策等重大工程应用问题中的极其重要的作用.系统整体上达到国际先进水平.相关专利:一种基于信息挖掘的智能决策支持
32、构造方法,规则举例进口国是日本,加工费小于5元提供设备价款小于10000、可供辅料价款小于100000那么申请合同类型为进料合同。进口料件原值1百万以内、加工给小于100000,那么进口料件总值1百万以内加工贸易方式为0、可供辅料价款小于100000,那么加工费小于100000。意义:为加工企业提供有偿数据服务为决策提供服务建立加贸决策支持系统为企业、领导提供决策提供经济形势预报,国际商务,国际商务,数字资源整合,项目背景:无论是数字图书馆中的图书文献资源,还是互联网上的信息,其最大的特点是一个可以提供资源服务的平台,但由于有别于传统的数值型的资源形式,因此对它们的整合、利用呈现出新特点:1)
33、资源形式以半(非)结构化的形式为主;2)信息的存储形式没有规范,导致很难对信息进行整合和加工;3)对信息的利用主要是以检索为手段,定位用户感兴趣的信息,其时间复杂度和效率很低;4)面对海量的这种半结构化和非结构化的信息,传统的处理手段无法满足需要等.对这些新的问题,传统的以关系数据库为主要存储机制和在这个基础上的数据整合技术显得无能为力.为解决这些问题,我们将数据挖掘创新模型与算法应用到工程实践中,完成了“基于数据挖掘的数字资源整合、服务平台及监管系统建设”这一大型项目,在实践中取得了可观的经济效益.,项目成果:“瑞采系列”产品实现对互联网信息的定向搜索,用户可以根据自身的特点建立信息分类体系
34、,并对采集到的信息进行自动的加工,用户可以从客户端定制自己感兴趣的内容,系统则可以为用户提供信息的互动推送服务.既可以适合个人用户,也可以用在行业领域中的个人网站、电子商务网站和企业网站等门户中使用,自产品问世以来,销售业绩逐年上升,销售额达400多万元.构造了中国工程科学技术图书馆的数字平台NSTL,陕西、江苏、浙江、云南、江苏等省的科技情报研究所的文献服务平台,平台建立后这些单位的文献服务数量每年递增了20%以上,几个服务平台原来每年提供文献服务量约为500万篇,按平均每篇的价格为2元,每年递增20%的绝对数量为100万左右,使用户效益每年增加300万元以上.通过帮助政府监管部门建立对互联
35、网信息的网络监管系统,仅人力和设备每年就为国家节省资金200多万元.,中医应用,项目背景:与中国中医研究院合作,对路志正教授调理脾胃法治疗胸痹及其相关疾病个体诊疗临床病历目标:运用小量采集系统里结构化的精华病历数据,初步探索寻找出路老调理脾胃治疗胸痹思想的规律,并以此为基础,着重研究冠心病治疗方案,路志正,男,汉族,1921年12月出生,祖籍河北省藁城市中国中医科学院广安门医院主任医师,研究生导师。第一批国家级老中医药专家学术经验指导老师,首批国务院政府特殊津贴获得者。由于医德高尚、医术精湛,2005年被国家中医药管理局授予“国医大师”称号。,数据范围:路老治疗胸痹及其相关疾病的67例病例(168例次),包括冠心病(32例)、心律失常、心脏神经官能症、风心病等相关疾病。分析方法:对症状、证候、药物的数据研究相应的预处理方法通过KDD*软件进行关联分析症状之间症状与证候之间证候与药物之间意义:揭示症状之间的关联性揭示症状与证侯之间的关联性,进而对老中医的诊病规律进行总结揭示证侯与药物之间的关联性,总结老中医诊治规律进一步建立基于老中医医疗经验的辨证论治知识库系统,症状关联部分结果,症状与证候部分结果,证候与药物部分结果,谢谢各位!,