毕业设计(论文)基于Web的行业新闻采集系统.doc

上传人:laozhun 文档编号:3980041 上传时间:2023-03-30 格式:DOC 页数:74 大小:2.20MB
返回 下载 相关 举报
毕业设计(论文)基于Web的行业新闻采集系统.doc_第1页
第1页 / 共74页
毕业设计(论文)基于Web的行业新闻采集系统.doc_第2页
第2页 / 共74页
毕业设计(论文)基于Web的行业新闻采集系统.doc_第3页
第3页 / 共74页
毕业设计(论文)基于Web的行业新闻采集系统.doc_第4页
第4页 / 共74页
毕业设计(论文)基于Web的行业新闻采集系统.doc_第5页
第5页 / 共74页
点击查看更多>>
资源描述

《毕业设计(论文)基于Web的行业新闻采集系统.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)基于Web的行业新闻采集系统.doc(74页珍藏版)》请在三一办公上搜索。

1、景德镇陶瓷学院工学学士学位论文(设计)题目:基于Web的行业新闻采集系统学 号: 姓 名: xxxx 院 (系): 信息工程学院 专 业: 信息管理与系统 完成日期: 指导老师: 分类号 学校代码 UDC 密级 学 号 景德镇陶瓷学院信息工程学院毕业论文基于web的行业新闻采集系统指导老师:xxxx 副教授 景德镇陶瓷学院 信息工程学院申请学位级别 学士 专业名称 xx信息管理与系统论文提交日期 2011年12月28日论文答辩日期 2011年1月5日学位授予单位和日期 景德镇陶瓷学院 答辩委员会主席: xxxxxx 论文评阅人: 2011年1月5日摘 要随着互联网的飞速发展,信息时代的到来,面

2、对网络上泛滥的新闻信息,而采集和过滤一些有用的信息对于我们来说是十分重要的。行业新闻采集系统是将非结构化的新闻文章从多个新闻来源网页中抽取出来保存到结构化的数据库中的过程。尤其是对于大型门户网站,比如新浪,腾讯他们每天的网站信息都更新,而且范围很广,全国各地,甚至全球发生的信息都能每天看到更新,而他们正是利用采集系统从各大媒体网站,外国网站采集过来的。因此,信息的采集至关重要。一般的网站新闻发布平台都是采用人工输入信息,对于中小型网站这样的工作量很算可以,但是网站大了,信息就很庞大了,像那种分类信息网,更新的工作就变得很复杂,如果有专门的类似搜索引擎能检索采集到最新的行业信息然后发布在自己的网

3、站上,因此建立专门的行业新闻采集系统,从相关行业网站采集有效的新闻信息,比如采集陶瓷行业新闻,从各大陶瓷网站采集有关陶瓷关键字的新闻列表,然后帅选入库,可以减少很多工作量,而且可以有效的进行修改和过滤工作。目前比较有名的采集系统有火车头,视采新闻采集器2、万能新闻采集器、新浪新闻采集器。关键字:行业新闻采集;.net;SQL server AbstractWith the rapid development of the Internet, the advent of the information age, face the flood of news information network

4、, and the collection and filter some useful information for us, it is very important. News gathering system is will unstructured news articles from multiple sources of news page extracted saved to the structural database in process.Especially for large web portal, such as sina, tencent every day the

5、y website information updates, and the range is very wide, all over the country, and even the global happened to see update information every day, and they are the use of acquisition system from the major media web site, foreign web site collected.Therefore, the collection of the information is very

6、 important. The general web news release platform are using artificial input information, for small and medium website such workload is calculate can, but the site is big, the information is very big, like the classification and information network, update the work is very complex, if have special s

7、imilar search engine can retrieve collection to the latest information and then released on his website, thus establishing special collection system, from related website collection effective news information can reduce a lot work load, and can effectively modified and filter work. At present more f

8、amous collection system has a locomotive, depending on the mining news terminal 2; Universal news collector; Sina news collector.Keywords: news collection;.net;SQL server目录摘 要IAbstractII目录III第一章 引 言11.1 课题背景11.2 开发系统的意义11.3 课题名称21.4 问题描述2第二章 可行性研究32.1 经济可行性32.2 技术可行性32.3 开发工具简介42.3.1关于Visual Studio

9、201042.3.2关于ASP.NET52.3.3关于SQL Server 200552.4 工厂模式三层架构介绍6第三章 系统分析93.1 功能需求93.2 性能需求93.3 运行需求93.4 数据流图103.5 用例图113.5.1类别管理用例113.5.2用户管理用例113.5.3入库管理用例113.5.4采集管理用例123.5.5权限管理用例123.5.6新闻管理用例123.6 数据字典133.7 概念结构设计143.7.1实体图143.7.1总体数据实体关系图153.8 逻辑结构设计163.9 数据库主要表结构说明183.10 物理结构设计18第四章 总体设计214.1 总体功能模块

10、设计214.2 模块功能细化214.2.1 新闻类别管理214.2.2新闻管理224.2.3 用户管理224.2.4 权限管理224.2.5入库新闻管理224.2.6采集管理22第五章 详细设计235.1 系统行为视图模型设计235.1.1 新闻管理活动图235.1.2 新闻类别管理活动图235.1.3 入库管理活动图245.1.4 用户管理活动图245.1.5权限管理活动图245.2 系统交互视图模型设计255.2.1用户管理255.2.2 新闻类别管理255.2.3新闻管理255.2.4采集管理265.2.5采集入库管理265.2.6 权限管理265.3 类图275.3.1接口层类图275

11、.3.2工厂类图285.3.3数据库访问层285.3.4业务逻辑层类图295.3.5数据库通用辅助层305.3.6实体层类图305.3.7页面辅助层类图315.3.8系统总体架构图31第六章 系统实现336.1 ADO.NET的使用336.2前台技术376.3系统运行界面426.4 采集管理功能实现436.5 入库管理功能实现476.6 新闻管理实现496.7 新闻类别管理506.8 用户管理实现526.9 权限管理53第七章 系统测试567.1 测试目的567.2 测试方案56总 结58参考文献59致 谢60附 录61附录一 系统使用说明书61附录二:信息采集63第一章 引 言1.1 课题背

12、景信息自古就有无限的价值,随着时代的不断发展,人类不知不觉已经来到了信息时代,各行各业都充斥了无数的信息,而信息的价值就在于信息的流通,如果信息能够及时的流通和传递起来,才能发挥信息真正的不可比拟的价值。在市场经济条件下,信息已经成为一种极其重要的商品。信息社会通常被定义为信息生产和消费的集中。信息集中度取决于对信息的需求以及此需求被满足的程度。因此,一种看待信息社会是否形成的方法是评价信息的交换强度及信息内部流动的持久性。那么,什么是信息价值?它的价值如何确定?这些问题已成为当今信息社会所面临的最基本问题之一。近年来,行为经济学把经济学理论和心理学理论结合起来研究信息的主观价值,取得了一定的

13、成果。这些研究成果对于我们认识了解信息价值的确定和市场经济条件下人们对信息的需求特性,具有重要的启示作用。 如何从海量信息中收集有价值的信息资料,并进行分析研究,形成企业各种决策的依据,是信息人员及市场研究人员所面临的一个问题。信息必须经过汇总、整合、分析才能产生价值,零散的信息只能是新闻性的,无法体现真正的商业价值。 对于企业以及信息分析人员来说,一方面要在大量的信息中过滤出有效的价值点,同时又要降低获取相应信息的成本,使信息的实际使用价值大于收集、分析信息等过程所产生的成本,使信息为企业的决策带来增值价值。21世纪是信息时代,掌握了迅速便捷的信息就能在激烈的竞争中占取主动,而正是信息的这种

14、金子般的价值也注定了信息本身就是一个行业一个产业。而这种行业将为社会做出巨大的贡献,所以我这个课题就是关于收集共享信息的。1.2 开发系统的意义我要完成的设计能够通过各种手段来收集各行业的一些杂乱庞大的信息,并总结分析出许多有用的有价值的信息。例如我们对一个行业的众多企业收集他们的企业的各种信息,小到工人日常支出,大到企业年产值及企业竞争力。少数的信息看起来并没有什么价值,但是一旦我们能够获取到整个行业大部分重要企业的大量信息,并且这种信息是可以实时更新的,我们就会发现,通过各种数据的分析排名,我们可以了解到数据背后的东西,例如可以根据工人的平均工资来了解到某个行业中工人待遇的企业排名。可以根

15、据企业的总产值的排名来大概了解在这个行业中企业的竞争力的排名。像这些经过分析处理过的信息才是真正有价值的信息,当然信息的处理可以根据使用者自身的需求来选择处理信息的方式,例如一些函数的组合或者是统计学方法。总之,通过这个网站,对于行业的数据采集分析并形成有巨大的价值的过程有着很大的推进的意义。这个课题,其实原理和方法都是简单通俗易懂的,但是改变人们生活方式,推动社会进步的恰恰是那些简单的发明创造,当然这个课题可能达不到这样的高度,但这样的尝试是非常有价值的。因为它架设起来容易,复杂的使我们具体去操作,例如收集企业信息,我们可以通过与政府的合作来收集,也可以通过问卷调查来收集,还可以让企业自己登

16、陆我们的网站来添加信息。在日新月异的信息时代,掌握信息的快速流通手段,在某种程度上我们就走在了时代行业的前列,所以我想这个课题在某种程度上有着划时代的意义。像这种课题,在国外发展已经非常成熟,在国内则刚刚起步,例如国外的福布斯排名,国内的胡润排名,所以,从商业上看,这个行业还是非常有前途的。1.3 课题名称课题名称:基于Web的行业新闻采集系统。1.4 问题描述本课题所设计的目标是行业新闻采集系统(Web News collection System),采用Internet/Intranet方式,是基于浏览器/服务器的管理系统,它由客户在客户端通过浏览器访问服务器上的系统的应用程序,进行网页信

17、息采集,帅选,审核,入库等一系列操作。第二章 可行性研究基于web的行业新闻采集系统是基于B/S模型的设计理念的系统,它能提供批量采集指定站点,编辑采集项目,帅选和审核入库功能,现就其可行性如下:2.1 经济可行性首先,由于现在的企业的迅速发展使得企业每天的业务量、工作量是越来越大。而且应对企业宣传、人员招聘、产品宣传等工作,处理和传递信息,企业往往需要增加宣传、招聘服务人员,以提高工作效率,这无疑会大大增加企业的成本,而且这个费用开支是持续、递增的。而开发一个简单的通用的采集系统能够整合到一般的网站项目中,代替人工输入,大大减少劳动力和成本。其次,如果说建设大型的专业性的网站平台,需要企业斥

18、资聘请专业的团队定制和管理,那么对于功能需求相对普及化的中小型站点,就没有能力也没有必要付出这么昂贵的代价。对于一般性的中小型网站建设,完全可以花费很少的资本,选择合适的采集系统进行搭建,从而以较少的投入获得较高的效益。总的来说,开发一个这样的系统费用不是很高,而系统带来的方便和效益是原始操作方式所无法比拟。而且是一劳永逸的事情。从经济上考虑,本采集系统是可行的。2.2 技术可行性 本系统采用微软的面向对象语言C#,加上B/S架构语言ASP.NET 。 本系统将很好地和各种类型的信息网站整合,并且可以二次开发,自定义功能配置 。 采用本系统只需添置低档计算机,如果条件允许,可以使用P4以上配置

19、。 采用本系统不会对现有软件会产生冲突。 用户只需要短时间来熟悉本系统。 利用好现有技术和人员,完全可以实现预期目标。2.3 开发工具简介2.3.1关于Visual Studio 2010图2-1 vs 架构图Chart2-1 vs framwork architectureVisual Studio 2010 提供了高级开发工具、调试功能、数据库功能和创新功能,帮助在各种平台上快速创建当前最先进的应用程序。 Visual Studio 2010 包括各种增强功能,例如可视化设计器(使用 .NET Framework 4.0加速开发)、对 Web 开发工具的大量改进,以及能够加速开发和处理所有

20、类型数据的语言增强功能。Visual Studio 2010 为开发人员提供了所有相关的工具和框架支持,帮助创建引人注目的、令人印象深刻并支持 AJAX 的 Web 应用程序。 开发人员能够利用这些丰富的客户端和服务器端框架轻松构建以客户为中心的 Web 应用程序,这些应用程序可以集成任何后端数据提供程序、在任何当前浏览器内运行并完全访问 ASP.NET 应用程序服务和 Microsoft 平台。 快速的应用程序开发为了帮助开发人员迅速创建先进的软件,Visual Studio 2010 提供了改进的语言和数据功能,例如语言集成的查询 (LINQ),各个编程人员可以利用这些功能更轻松地构建解决

21、方案以分析和处理信息。 Visual Studio 2010 还使开发人员能够从同一开发环境内创建面向多个 .NET Framework 版本的应用程序。开发人员能够构建面向 .NET Framework 2.0、3.0 或 3.5及4.0 的应用程序,意味他们可以在同一环境中支持各种各样的项目。 突破性的用户体验Visual Studio 2010 为开发人员提供了在最新平台上加速创建紧密联系的应用程序的新工具,这些平台包括 Web、Windows Vista、Office 2007、SQL Server 2008 和 Windows Server 2008。对于 Web,ASP.NET A

22、JAX 及其他新技术使开发人员能够迅速创建更高效、交互式更强和更个性化的新一代 Web 体验。 高效的团队协作Visual Studio 2010提供了帮助开发团队改进协作的扩展的和改进的服务项目,包括帮助将数据库专业人员和图形设计人员加入到开发流程的工具。2.3.2关于ASP.NET2001年,微软在前面三个版本的ASP基础上,推出了全新的ASP.NET,它开始抛弃前面三个版本都在使用的脚本语言,而是使用Visual Basic.NET作为它的默认语言。与ASP程序是解释执行的不同,在ASP.NET中,所有的程序执行都是经过服务器编译的,在执行效率上有很大的提高,也更稳定。其结构也与前面的版

23、本大相径庭,几乎完全是基于组件和模块化的,Web应用程序的开发人员使用这个开发环境可以实现更加模块化的、功能更强大的应用程序。2.3.3关于SQL Server 2005 SQL Server 2005是一种高效的关系数据库系统。用户通过SQL Server 2000提供的各种管理和维护工具,可以方便、灵活、快捷地实现对数据的管理、分析和维护;同时,SQL Server 2005还提供了以Web标准为基础的可扩展数据库编程功能和支持大量的XML和Internet标准,允许用户通过系统内置存储过程和XML格式来存储和检索数据。SQL Server 2005凭借其高度的可靠性和可伸缩性,已成为建立

24、企业级应用系统的优秀平台。SQL Server 2005的程序设计模型与Windows DNA(分布式因特网应用程序体系结构)密切集成,可用以开发Web应用程序,而且SQL Server 2005支持英语查询(English Query)和Microsoft搜索服务等功能,在Web应用程序只能感包含了友好的查询和强大的搜索功能。2.4 工厂模式三层架构介绍一、什么是三层结构 在软件体系架构设计中,分层式结构是最常见,也是最重要的一种结构。微软推荐的分层式结构一般分为三层,从下至上分别为:数据访问层、业务逻辑层(又或成为领域层)、表示层 二、三层结构的优点 1、开发人员可以只关注整个结构中的其中

25、某一层; 2、可以很容易的用新的实现来替换原有层次的实现; 3、可以降低层与层之间的依赖; 4、有利于标准化; 5、利于各层逻辑的复用。 图2-1 文档结构图Chart2-2 document architecture三、分层式结构缺陷: 1、降低了系统的性能。这是不言而喻的。如果不采用分层式结构,很多业务可以直接造访数据库,以此获取相应的数据,如今却必须通过中间层来完成。 2、有时会导致级联的修改。这种修改尤其体现在自上而下的方向。如果在表示层中需要增加一个功能,为保证其设计符合分层式结构,可能需要在相应的业务逻辑层和数据访问层中都增加相应的代码。 四、三层架构的适用场合 一般适合于中大型项

26、目,比较小型的项目一般不建议采用三层架构三层架构(3-tier application):通常意义上的三层架构就是将整个业务应用划分为:WEB表示层(UI)、业务逻辑层(BLL)、数据访问层(DAL)。区分层次的目的即为了“高内聚,低耦合”的思想。在ASP.NET下进行数据的开发,运用三层架构可以让代码的可读性和功能的扩展性有很好的提高。首先图2-3 三层架构图Chart2-3 Three-tier architecture上图是普通三层架构模型,页面层没有直接和数据库关联,而是通过业务逻辑层访问数据访问层,而数据访问层是具体的实现,只能访问某一类数据库类型。考虑到可能用于不同的数据库环境,因

27、此采用工厂模式的三层架构 图2-4 工厂三层架构图Chart2-4 Factory Three-tier architecture界面层没有直接访问数据库,而是访问业务逻辑层,并且可以通过工厂动态切换到不同的数据库,只要都实现IDAL访问接口就可以,其中工厂创建不同的数据库时用到了反射技术,只需要调用DLL类型的程序集,每次访问都将缓存起来,减轻服务器的压力。第三章 系统分析3.1 功能需求 能够实现文章(包括分类新闻)的发布,并实现查询、修改、删除等功能; 能够对管理员用户的添加,删除,修改功能; 能够入库的新闻进行查询、修改、删除功能; 对新闻类别,添加分类,进行查询、修改、删除等功能;

28、能够添加采集项目,设置采集参数,并能修改和添加; 能够进行列表页链接参数的修改、添加、删除等; 设置不同的管理和操作权限,并且分配给用户。3.2 性能需求 时间特性一般操作的响应时间应在1-2秒内,对软磁盘响应时间也应在可接受的时间内完成。 灵活性当用户需求,如操作方式,运行环境,结果精度,数据结构于其他软件接口等发生变化时,设计的软件要做适当调整,灵活性非常大。3.3 运行需求 用户界面使用Browser-Server架构,在客户端不需要安装专门的程序,用户使用时就像在浏览网页一般,非常容易上手。 硬件接口支持一般奔腾133,16兆以上内存的pc机。 软件接口 运行在Microsoft Wi

29、ndows系列平台上 故障处理在开发阶段可以随时修改数据库里的相应内容。3.4 数据流图管理员登录系统之后,首页进入每个页面操作之前都会判断有没有想应的权限,然后可以进行六大栏目的管理,分别是采集管理,入库管理,用户管理,新闻挂历,类别管理,权限管理。核心部分是采集管理,管理员首先添加采集项目,设置站点,采集列表页地址,然后进行采集,采集完成之后进入入库管理栏目,审核相关采集的新闻,然后选择是否删除和添加入库。入库完成之后就进入了新闻管理栏目,可以对新闻进行更新,删除操作。类别管理是管理对新闻进行分类,比如有体育新闻,娱乐新闻等类别的添加和删除,修改操作。用户管理是添加删除,修改用户操作。添加

30、用户后要进行权限的分配,进入权限管理栏目,可以对用户进行权限赋值操作。图3-1 总体数据流图Chart3-1 Whole DFD3.5 用例图3.5.1类别管理用例管理员输入账号密码之后登陆系统,根据权限可以进行查看添加删除,修改类别的操作。 图3-2 新闻类别用例图Chart3-2 Class User Case 3.5.2用户管理用例系统用户登录后判断是否有查看用户账号和密码的权限,如有可以进行查看,但是添加删除权限也是要判断的。普通用户只能查看个人账号密码,而超级管理员才具备查看全部,添加删除和修改的权限。图3-3 管理员管理用例图Chart3-3 User illustration3.

31、5.3入库管理用例系统用户登录之后,判断是否有相应操作权限,可以对入库的新闻进行入库操作,入库之前可以删除新闻,入库之后会清除入库新闻表。图3-4 入库管理用例图Chart3-4 import dataBase illustration3.5.4采集管理用例系统用户登录之后,首先判断权限,然后根据拥有的权限可以进行添加采集站点,添加采集列表,添加采集链接地址,编辑列表,编辑站点,采集测试,删除采集项目操作。图3-5 新闻采集管理用例图3.5.5权限管理用例普通管理员只有查看相应权限,而超级管理员可以修改系统用户的权限值。图3-6 权限管理用例图Chart3-6 Role illustratio

32、n Chart3-5 collect illustration3.5.6新闻管理用例管理员登录之后,查看相应的权限,然后进行新闻的修改和删除操作。图3-6 权限管理用例图Chart3-6 Role illustration3.6 数据字典在数据流图的基础上,定义数据字典。数据字典是关于数据库中数据的描述,它的作用是在软件分析和设计过程中为有关人员提供关于数据描述信息的查询,以保证数据的一致性。下面举例说明数据字典的定义。名字:新闻别名:无描述:定义新闻的相关内容,可唯一地确定一次新闻记录定义:新闻=新闻ID+文章名称+文章内容+文章发布者+文章发布时间+文章分类+文章来源+关键字+文章图片+简

33、介+是否有图片+静态标签+添加时间位置:存储于新闻信息表,输出到新闻编辑名字:新闻分类别名:无描述:定义新闻的具体分类定义:类别=分类ID+分类名称+父类ID+显示顺序位置:分类信息表名字:采集项目别名:无描述:定义有关采集的相关信息定义:采集项目=ID+ 类别ID+采集名称+网站地址+网站名称+网页编码+项目标记+列表页地址+列表页开始标记+产列表页结束标记+链接开始+链接结束+标题开始+标题结束+关键字开始+关键字结束+日期正则+来源正则+内容开始+内容结束+下一页开始+下一页结束+下一页正则+过滤标记+是否保存图片+排序Id+采集状态位置:存储于数据库采集项目表,输出到采集项目编辑名字:

34、用户别名:无描述:定义用户信息定义:用户 = 用户ID+账号+密码位置:用户信息表名字:用户权限表别名:无描述:定义用户的权限定义:用户权限 =权限ID+用户ID+权限值位置:权限表,输出到权限编辑名字:待审核入库新闻表别名:无描述:定义新闻的信息定义:入库新闻= 新闻信息表的定义位置:待审核入库新闻表3.7 概念结构设计3.7.1实体图 图3-7管理用户实体图 Chart3-7 Entity chart of user 图 3-8 用户权限实体图 Chart3-8 Entity chart of roles图 3-9 新闻分类实体图Chart3-9 Entity chart of Class

35、 图 3-9 新闻实体图 Chart3-9 Entity chart of news 图 3-10 采集项目实体图Chart3-10 Entity chart of collitem图 3-11 待审核新闻实体图Chart3-11 Entity chart of collect3.7.1总体数据实体关系图E-R图由3个相关联的部分构成,即实体、实体与实体之间的关系以及实体和关系的属性。图3-6 总体E-R图Chart3-6 Whole E-R Chart of The System3.8 逻辑结构设计本阶段把上一阶段得到的ER图转化为关系模型,根据转换规则以及范式理论,得到市场管理和客户服务管

36、理部分的如下几个关系模式(下划线表示主键):图3-7 总体数据表Chart3-6 Whole tables of The SystemClass(Id,ClassName,ParentId,OrderBy);News(ID,ClassId,Title ,Author ,Source ,AddTime ,TxtContent ,KeyWord ,About ,StrImg ,CreateHtml ,IsImg,DateTime);Collect(ID,ClassId,Title ,Author ,Source ,AddTime ,TxtContent ,KeyWord ,About ,StrIm

37、g ,CreateHtml ,IsImg,DateTime);CollItem (ID,ItemName ,ClassId ,WebEncode ,WebName ,WebUrl ,ItemRemark ,ListUrl ,ListStart ,ListEnd ,LinkStart ,LinkEnd ,TitleStart ,TitleEnd ,KeyWordStart ,KeyWordEnd ,DateRegex ,SourceRegex ,ContentStart ,ContentEnd ,RemoveBodyStart ,RemoveBodyEnd ,NextPageRegex ,Scr

38、ipt_Iframe,Script_Object ,Script_Script,Script_Div,Script_Table ,Script_Span ,Script_Img ,Script_Font ,Script_A ,Script_Html,CollecNum ,IsSaveImg ,IsDesc ,State)Roles(ID,UserId,RoleArg);User(ID,UserName,UserPwd)3.9 数据库主要表结构说明l 新闻表(News)新闻ID(主键),文章名称,文章内容,文章发布者,文章发布时间,文章分类,文章来源,关键字,文章图片,简介,是否有图片,静态标签

39、,添加时间l 分类表(Class)ID(主键),分类名称,父类ID,排序l 用户表(User)ID(主键)、账号、密码l 权限表(Roles)ID(主键),用户ID,权限值l 采集新闻表(Collect)新闻ID(主键),文章名称,文章内容,文章发布者,文章发布时间,文章分类,文章来源,关键字,文章图片,简介,是否有图片,静态标签,添加时间l 采集项目表(CollItem)ID(主键)+ 类别ID+采集名称+网站地址+网站名称+网页编码+项目标记+列表页地址+列表页开始标记+产列表页结束标记+链接开始+链接结束+标题开始+标题结束+关键字开始+关键字结束+日期正则+来源正则+内容开始+内容结束

40、+下一页开始+下一页结束+下一页正则+过滤标记+是否保存图片+排序Id+采集状态3.10 物理结构设计通过对以上关系模式、数据流图、数据字典的分析,我们采用SQL Server 2005来做后台数据库系统,在此对数据库表格设计如下:表3-1 类别表Table 3-1 Class表3-2 新闻信息表Table 3-2 News 表3-3 用户表 Table 3-3 User 表3-4 采集项目表 Table 3-4 CollItem 表3-6 权限表 Table 3-6 Roles 表3-5 采集新闻表 Table 3-5 Collect第四章 总体设计4.1 总体功能模块设计层次结构图如图4-

41、1所示:图4-1 系统层次结构图 Layer structure chart of the System4.2 模块功能细化采集系统的基本功能包括:文章信息管理、企业信息管理、基本信息管理、管理员信息管理、产品信息管理、招聘信息管理等。现就各个模块的主要功能分析如下:4.2.1 新闻类别管理类别管理主要提供文章信息的录入、查询、修改、删除等功能。可以无限极分类新闻,并且成树状展开。4.2.2新闻管理新闻管理主要是对各类新闻的修改、删除。4.2.3 用户管理用户管理包括添加和删除修改账户密码,并且只有超级用户才能查看和添加管理员的功能。4.2.4 权限管理权限管理主要是当前所有用户的权限进行查看

42、和分配功能。对于不同的用户所分配的权限是不同的,一般分为普通管理员和超级用户,普通用户只能采集,入库,新闻和类别管理,而超级用户权限最大,可以管理用户和权限设置。4.2.5入库新闻管理待入库新闻的审核然后直接入库和批量入库管理,并且清空采集列表。4.2.6采集管理包括用户管理和修改密码。用户管理是高级管理员对初级管理员的修改或者删除,修改密码是管理员修改自己密码。第五章 详细设计通过详细设计,我们将要设计出程序的“蓝图”,得出对目标系统的精确描述。本系统在详细设计阶段,采用过程设计工具程序流程图来对系统控制流程、处理功能、数据组织等细节进行设计。程序流程图又称为程序框图,其优点是对控制流程的描

43、述非常直观。而且,程序流程图历史悠久,为最广泛的人所熟悉。5.1 系统行为视图模型设计对象的行为可以用活动图来描述,活动图用于展现多个对象活动的总次序,一般用来描述系统在文体域空间中的活动流程,也可以方便地描述系统中的并发活动。本系统的活动图分析如下:5.1.1 新闻管理活动图图5-1 新闻管理活动图Chart5-1 News Manage Activity diagram5.1.2 新闻类别管理活动图图5-2 新闻类别活动图Chart5-2 Class Manage Activity diagram5.1.3采集项目活动图图5-3 采集管理活动图Chart5-3 Colletion Mana

44、ge Activity diagrams5.1.3 入库管理活动图图5-4 入库管理活动图Chart5-4 CollItem Manage Activity diagram5.1.4 用户管理活动图图5-4 用户管理活动图Chart5-4 User Manage Activity diagram5.1.5权限管理活动图图5-5权限管理活动图Chart5-2 Roles Manage Activity diagram5.2 系统交互视图模型设计交互视图模型描述系统的业务逻辑,对象间的动态协作关系可以用序列图来描述,序列图展现对象之间交互动作的时序特性,从动态的角度描述系统用例实现时,各类的交互和实现。本系统的序列图分析如下:5.2.1用户管理图5-6 用户管理序列图Chart5-6 User Sequence diagram5.2.2 新闻类别管理图5-7 新闻类别序列图Chart5-7 Class Sequence diagram5.2.3新闻管理图5-8 新闻管理序列图Chart5-8 News Sequence diagram5.2.4采集管理图5-9 采集管理序列图Chart

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号