《毕业设计论文基于Web行业数据采集、分析与发布系统的开发.doc》由会员分享,可在线阅读,更多相关《毕业设计论文基于Web行业数据采集、分析与发布系统的开发.doc(41页珍藏版)》请在三一办公上搜索。
1、摘要随着网络技术的飞速发展,网络技术正逐渐深入到社会生活的方方面面。因此我们要想在信息时代中掌握主动权,实现信息的快速流通,我们绝对离不开网络技术。当你想了解一个电脑公司的软件实力,你完全就可以查看一下他在IT行业中软件收入的排名来大概了解这个企业。但是能够提供这种信息服务的信息共享平台目前在国内还是比较少的,甚至在某种程度上还是空白。所以我要设计开发这样一个能够提供这种服务的信息平台。用户注册登陆之后可以添加企业信息,使用企业信息查询功能。管理员登录管理用户信息和企业信息。大量的信息在系统平台上凝聚,经过系统的企业信息查询功能模块分析处理后形成具有不同价值的新的信息。关键词:ASP.NET
2、,SQL Server,基于Web,数据采集分析IIAbstract With the rapid development of network technology, network technology is gradually penetrated into all aspects of social life. To seize the initiative in the information age, to play to maximize the value of information, we absolutely can not do without network tech
3、nology. When you want to know the strength of a computer software company, you can see what he has in software revenue in the ranking to learn about this business,but what can provide such information services, information-sharing platform is currently in the country is still relatively small, and e
4、ven to some extent is still blank. So I have to design and develop an information platform that can provide such a service.Users can add up enterprise information after landing.Administratorsresponsible for managinguser information andcorporate information.Keywords: ASP.NET,SQL Server database,Web-b
5、ased,Data Acquisition and Analysis目录1.前言11.1引言11.2课题研究背景21.3课题研究价值意义21.4设计要求3 1.5设计内容31.6章节设计32.相关技术介绍52.1 ASP.NET52.2 ASP.NET与IIS的结合62.3 C#语言系统72.4 SQL数据库管理与开发72.5 HTML简介113.需求分析143.1可行性分析143.2系统功能结构分析153.3数据库需求分析154.系统总体设计164.1用户模块164.2管理员模块174.3数据库设计185.系统实现245.1网站首页模块245.2用户模块实现255.3管理员模块实现326维护
6、网站356.1系统使用说明书356.2. 网站的维护工作357.总结36参考文献37致谢38III38基于Web行业数据采集、分析与发布系统的开发 1 前言1.1引言在信息技术飞速发展的今天,我们早已进入互联网络的信息时代,并且伴随着工业革命之后最大的信息革命,人类的生活已经发生了翻天覆地的变化。而信息革命中互联网已经俨然代替报纸电视等媒体成为名副其实的主战场。随着互联网的快速普及,互联网在娱乐、办公、消费、媒体、政府办公等我们生活的方方面面已经扮演着无可替代的作用,网民的数量也在2010年底达到了破纪录的4.57亿人,可以想象网络目前在我们生活中的作用以及将来它毕竟继续带给人类翻天覆地变化的
7、必然趋势。所以我们说信息革命,说信息共享,互联网必然是我们展开争夺的主战场。同样在经济快速发展的今天,我们只有掌握主动权才能在激烈的社会竞争中占得一席之地。那么怎么才能尽得先机呢?答案还是与我们的主题有关,就是能否快速获取我们想要的信息。正因如此,各种新闻媒体、电视网络媒体都应运而生,并且已经基本占据了我们的生活。我们的生活已经悄然离不开电视报纸和互联网。所以人们对于快速获取所需信息的这种需求使各种信息共享平台应运而生。为此,本设计同样也是适应时代发展于人们的急切需求,将要完成一个基本Web互联网的采集、分析与发布等功能于一体的系统。本设计的课题是“基于Web行业信息数据采集、分析与发布系统的
8、开发”,在设计的实现过程中,我们将采用ASP.NET开发平台与SQL Server 2000数据库以及C#开发语言等相关技术来共同实现该系统。以下就是对该系统的简介。基于Web行业数据采集、分析与发布系统简介:l 本系统选用B/S结构,采用当今流行的面向对象设计思想和先进的C#技术,基于SQL数据库开发,具有良好的开放包容性、优秀的易用性、高度的安全性,真正实现客户端的零配置化。l 本系统从实用的角度出发,实现行业数据的收集和管理、存储、发布,并辅以强大的数据检索和决策支持功能,真正实现前、后台信息整合,满足相关行业灵活多变的管理方法,从容面对市场的变化。主要包括基础数据维护,系统管理,注册用
9、户管理,省市管理,企业信息管理,站内新闻管理,友情链接管理,个人信息管理以及相应的数据查询和统计。l 本系统设计先进,功能设置灵活、精练,同时具有良好的人机会话,符合操作习惯和使用思维,各项功能也易学易用,从而真正实现系统的自动化,规范化和专业化,便于操作者掌握和使用,便于普及和推广。-1.2课题研究背景信息自古就有无限的价值,随着时代的不断发展,人类不知不觉已经来到了信息时代,各行各业都充斥了无数的信息,而信息的价值就在于信息的流通,如果信息能够及时的流通和传递起来,才能发挥信息真正的不可比拟的价值。在市场经济条件下,信息已经成为一种极其重要的商品。信息社会通常被定义为信息生产和消费的集中。
10、信息集中度取决于对信息的需求以及此需求被满足的程度。因此,一种看待信息社会是否形成的方法是评价信息的交换强度及信息内部流动的持久性。那么,什么是信息价值?它的价值如何确定?这些问题已成为当今信息社会所面临的最基本问题之一。近年来,行为经济学把经济学理论和心理学理论结合起来研究信息的主观价值,取得了一定的成果。这些研究成果对于我们认识了解信息价值的确定和市场经济条件下人们对信息的需求特性,具有重要的启示作用。 如何从海量信息中收集有价值的信息资料,并进行分析研究,形成企业各种决策的依据,是信息人员及市场研究人员所面临的一个问题。信息必须经过汇总、整合、分析才能产生价值,零散的信息只能是新闻性的,
11、无法体现真正的商业价值。 对于企业以及信息分析人员来说,一方面要在大量的信息中过滤出有效的价值点,同时又要降低获取相应信息的成本,使信息的实际使用价值大于收集、分析信息等过程所产生的成本,使信息为企业的决策带来增值价值。21世纪是信息时代,掌握了迅速便捷的信息就能在激烈的竞争中占取主动,而正是信息的这种金子般的价值也注定了信息本身就是一个行业一个产业。而这种行业将为社会做出巨大的贡献,所以我这个课题就是关于收集共享信息的。1.3课题研究价值意义我要完成的设计能够通过各种手段来收集各行业的一些杂乱庞大的信息,并总结分析出许多有用的有价值的信息。例如我们对一个行业的众多企业收集他们的企业的各种信息
12、,小到工人日常支出,大到企业年产值及企业竞争力。少数的信息看起来并没有什么价值,但是一旦我们能够获取到整个行业大部分重要企业的大量信息,并且这种信息是可以实时更新的,我们就会发现,通过各种数据的分析排名,我们可以了解到数据背后的东西,例如可以根据工人的平均工资来了解到某个行业中工人待遇的企业排名。可以根据企业的总产值的排名来大概了解在这个行业中企业的竞争力的排名。像这些经过分析处理过的信息才是真正有价值的信息,当然信息的处理可以根据使用者自身的需求来选择处理信息的方式,例如一些函数的组合或者是统计学方法。总之,通过这个网站,对于行业的数据采集分析并形成有巨大的价值的过程有着很大的推进的意义。这
13、个课题,其实原理和方法都是简单通俗易懂的,但是改变人们生活方式,推动社会进步的恰恰是那些简单的发明创造,当然这个课题可能达不到这样的高度,但这样的尝试是非常有价值的。因为它架设起来容易,复杂的使我们具体去操作,例如收集企业信息,我们可以通过与政府的合作来收集,也可以通过问卷调查来收集,还可以让企业自己登陆我们的网站来添加信息。在日新月异的信息时代,掌握信息的快速流通手段,在某种程度上我们就走在了时代行业的前列,所以我想这个课题在某种程度上有着划时代的意义。像这种课题,在国外发展已经非常成熟,在国内则刚刚起步,例如国外的福布斯排名,国内的胡润排名,所以,从商业上看,这个行业还是非常有前途的。1.
14、4设计要求l 构建基于Web行业数据分析采集发布系统的会员注册登陆系统基于Web行业数据采集分析发布系统提供给用户进入系统的入口,用户在注册一个新的会员后,输入用户名,设置密码可完成注册,注册后便可登入系统,接着就可以在网上添加企业详细信息或者获得想要的企业信息以及其他网站提供的功能。l 建立管理员后台管理系统管理员登录后台管理系统后,可以修改注册用户的各种信息,可以添加修改删除企业的各种信息。l 建立企业信息的查询排名系统注册用户可以查询到具体单个企业的信息,也可以根据所需查看各区县企业的各种排名从而了解到用户想要了解的有价值的信息。例如徐汇区IT企业的营业收入排名、软件外包排名、员工收入福
15、利排名等等信息。1.5设计内容为完成该系统网站的设计要求,相应工作主要是通过研究以下五个方面来实现:l 在Windows操作系统上构建Web服务器。l 了解网络数据库原理及相关技术。l 熟悉ASP.NET开发平台及SQL Server数据库的操作。l 利用VS 2008系统开发平台和C#开发语言并参考各种现有信息共享平台来设计我们的信息共享系统。l 基于Web行业数据采集、分析与发布系统的调试,运行。1.6章节设计本文第1章主要介绍一下课题背景意义以及研究设计内容要求等;第2章技术知识将对于ASP.NET开发平台以及IIS在Windows操作系统上构建Web服务器的方法做详细介绍,同时也将介绍
16、SQL Server数据库等一些其他相关技术;第3章需求分析,并且系统地介绍本课题的总体设计思想及各个模块所具备的功能,以及数据库分析;第4章将对各个模块的功能以及数据库进行详细说明设计;第5章将对系统的对主页以及各个功能做进一步讲解分析;第6章介绍系统相关的使用说明与网站的一些日常维护操作。2 相关技术介绍2.1ASP.NET2.1.1ASP.NET简介ASP.NET的前身ASP技术,是在IIS 2.0上首次推出(Windows NT 3.51),当时与 ADO 1.0 一起推出,在IIS 3.0 (Windows NT 4.0)发扬光大,成为服务器端应用程序的热门开发工具,微软还特别为它量
17、身打造了Visual InterDev开发工具,在1994年到2000年之间,ASP技术已经成为微软推展Windows NT 4.0平台的关键技术之一,数以万计的ASP网站也是这个时候开始如雨后春笋般的出现在网络上。它的简单以及高度可定制化的能力,也是它能迅速崛起的原因之一。在2000年第二季时,微软正式推动.NET策略经过四年的开发,第一个版本的ASP.NET在2002年1月5日亮相(和.NET Framework 1.0),Scott Guthrie也成为ASP.NET的产品经理(到现在已经开发了数个微软产品,像ASP.NET AJAX和Microsoft Silverlight)。目前最
18、新版本的 ASP.NET 4.0 以及 .NET Framework 4.0 已经在VS2010平台内应用。ASP.NET构架是可以用Microsoft(R)公司最新的产品Visual S开发环境进行开发,WYSIWYG(What You See Is What You Get所见即为所得)的编辑。这些仅是ASP.NET强大化软件支持的一小部分。因为ASP.NET是基于通用语言的编译运行的程序,所以它的强大性和适应性,可以使它运行在Web应用软件开发者的几乎全部的平台上(到现在为止只知道它只能用在Windows 2000/2003 Server/VISTA/7上)。通用语言的基本库,消息机制,
19、数据接口的处理都能无缝的整合到ASP.NET的Web应用中。ASP.NET同时也是language-independent(语言独立化)的,所以,你可以选择一种最适合你的语言来编写你的程序,或者把你的程序用很多种语言来写,现在已经支持的有C#(C+和Java的结合体),VB,Jscript,C+、F+。将来,这样的多种程序语言协同工作的能力保护您现在的基于COM+开发的程序,能够完整的移植向ASP.NET。ASP.NET一般分为两种开发语言,VB.NET和C#,C#相对比较常用,因为是.NET独有的语言,VB.NET则为以前VB程序设计,适合于以前VB程序员,如果新接触.NET,没有其他开发语
20、言经验,建议直接学习C#即可。2.1.2ASP.NET内置对象ASPNET提供了内置对象有Page、Request、Response、Application、Session、Server、Mail和Cookies。这些对象使用户更容易收集通过浏览器请求发送的信息、响应浏览器以及存储用户信息,以实现其他特定的状态管理和页面信息的传递。(1)Response对象。Response对象用来访问所创建的并客户端的响应,输出信息到客户端,它提供了标识服务器和性能的HTTP变量,发送给浏览器的信息和在cookie中存储的信息。它也提供了一系列用于创建输出页面的方法,如无所不在的Response . Wri
21、te方法。(2)Request对象。Request对象是用来获取客户端在请求一个页面或传送一个Form时提供的所有信息,这包括能够标识浏览器和用户的HTTP变量,存储在客户端的cookie信息以及附在URL后面的值(查询字符串或页面中段中的HTML控件内的值)。(3)简述Application对象。在ASP.NET环境下,Application对象来自HttpApplictionStat类。它可以在多个请求、连接之间共享公用信息,也可以在各个请求连接之间充当信息传递的管道。使用Application对象来保存我们希望传递的变量。由于在整个应用程序生存周期中,Application对象都是有效的
22、,所以在不同的页面中都可以对它进行存取,就像使用全局变量一样方便。(4)简述Session对象。Session对象就是服务器给客户端的一个编号。当一台Web服务器运行时,可能有若干个用户浏览正在浏览这台服务器上的网站。当每个用户首次与这台WWW服务器建立连接时,他就与这个服务器建立了一个Session,同时服务器会自动为其分配一个SessionID,用以标识这个用户的唯一身份。特别说明的是Session对象的变量只是对一个用户有效,不同的用户的会话信息用不同的Session对象的变量存储。在网络环境下Session对象的变量是有生命周期的,如果在规定的时间没有对Session对象的变量刷新,系
23、统会终止这些变量。(5)Server对象。Server对象提供对服务器上的方法和属性的访问。其中大多数方法和属性是作为实用程序的功能服务的。Server对象也是Page对象的成员之一,主要提供一些处理页面请求时所需的功能;例如建立COM对象、将字符串的编译码等工作。(6)Cookie对象。Cookie是一小块由浏览器存贮在客户端系统上(硬盘)的文本,是一种标记。由Web服务器嵌入用户浏览器中,以便标识用户,且随同每次用户请求发往Web服务器。Cookies的值比A S P.NET其他集合(例如Form和Server Variables )的值要复杂得多。(7)Mail对象。ASP.NET被赋予
24、了一个发送Email的新对象,名为SmtpMail,实际上Mail对象由System.Web.Mail类库实现(Class Library)。这个类库由MailMessage对象、SmtpMail对象、MailFormat对象和MailAttachment对象组成,它们相互合作,完成E-mail的发送。2.2 ASP.NET与IIS的结合在过去,客户端/服务器结构的设计与Web的相关技术几乎处于平行线上,两者相互独立并无法作出集成性的设计。现在我们利用IIS+ASP.NET,将客户机/服务器结构与Web密切结合,完成前后端两者的集成输出功能,使得Web站点的开发更方便,实现的功能更强大。利用I
25、IS+ASP.NET技术来集成Web前后端所带来的强大效益有:减少构建和维护成本,加快联机过程,应用软件集中在服务器端开发管理,前端可使用任何浏览器(Ie、Netscape),后端可存取数据库 (Sql Server)。2.2.1安装IIS若操作系统中还未安装IIS服务器,可打开“控制面板”,然后单击启动 “添加/删除程序”, 在弹出的对话框中选择 “添加/删除Windows组件”,在Windows组件向导对话框中选中“Internet信息服务(IIS)”,然后单击“下一步”,按向导指示,完成对IIS的安装。2.2.2启动Internet信息服务(IIS)Internet信息服务简称为IIS,
26、单击Windows开始菜单-所有程序-管理工具-Internet信息服务(IIS)管理器,即可启动“Internet信息服务”管理工具。2.2.3配置IISIIS安装后,系统自动创建了一个默认的Web站点,该站点的主目录默认为C:Inetpubwww.root。用鼠标右键单击“默认Web站点”,在弹出的快捷菜单中选择“属性”,此时就可以打开站点属性设置对话框,在该对话框中,可完成对站点的全部配置。2.2.4主目录与启用父路径单击“主目录”标签,切换到主目录设置页面,该页面可实现对主目录的更改或设置。注意检查启用父路径选项是否勾选,如未勾选将对以后的程序运行有部分影响。主目录配置-选项。2.2.
27、5设置主页文档单击“文档”标签,可切换到对主页文档的设置页面,主页文档是在浏览器中键入网站域名,而未制定所要访问的网页文件时,系统默认访问的页面文件。常见的主页文件名有index.htm、index.html、index.asp、index.php、index.jap、default.htm、default.html、default.asp等。IIS默认的主页文档只有default.htm和default.asp,根据需要,利用“添加”和“删除”按钮,可为站点设置所能解析的主页文档。2.2.6启动与停止IIS服务在Internet信息服务的工具栏中提供有启动与停止服务的功能。单击可启动IIS服
28、务器;单击 则停止IIS服务器。2.3 C#语言系统C#(读做 C sharp,中文译音“夏普”)是微软公司发布的一种面向对象的、运行于.NET Framework之上的高级程序设计语言,并定于在微软职业开发者论坛(PDC)上登台亮相.C#是微软公司研究员Anders Hejlsberg的最新成果.C#看起来与Java有着惊人的相似;它包括了诸如单一继承,界面,与Java几乎同样的语法,和编译成中间代码再运行的过程.但是C#与Java有着明显的不同,它借鉴了Delphi的一个特点,与COM(组件对象模型)是直接集成的,而且它是微软公司.NET windows网络框架的主角。2.4 SQL数据库
29、管理与开发2.4.1SQLSQL全称是“结构化查询语言(Structured Query Language)”,最早的是IBM的圣约瑟研究实验室为其关系数据库管理系统SYSTEM R开发的一种查询语言,它的前身是SQUARE语言。SQL语言结构简洁,功能强大,简单易学,所以自从IBM公司1981年推出以来,SQL语言,得到了广泛的应用。如今无论是像Oracle ,Sybase,Informix,SQL server这些大型的数据库管理系统,还是像Visual Foxporo,PowerBuilder这些微机上常用的数据库开发系统,都支持SQL语言作为查询语言。SQL是高级的非过程化编程语言,允
30、许用户在高层数据结构上工作。他不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统可以使用相同的SQL语言作为数据输入与管理的接口。它以记录集合作为操纵对象,所有SQL语句接受集合作为输入,返回集合作为输出,这种集合特性允许一条SQL语句的输出作为另一条SQL语句的输入,所以SQL语言可以嵌套,这使他具有极大的灵活性和强大的功能,在多数情况下,在其他语言中需要一大段程序实现的一个单独事件只需要一个SQL语句就可以达到目的,这也意味着用SQL语言可以写出非常复杂的语句。 SQL同时也是数据库文件格式的扩展名。 SQL语言包含4个部分: 数据
31、定义(DDL)语言(如CREATE, DROP,ALTER等语句) 数据操纵(DML)语言(INSERT, UPDATE, DELETE语句)数据查询语言(SELECT语句) 数据控制语言(如GRANT,REVOKE,COMMIT, ROLLBACK等语句) SQL(STructured Query Language)是一种资料库查询和程式设计语言,用於存取资料以及查询、更新和管理关联式资料库系统。美国国家标准局(ANSI)与国际标准化组织(ISO)已经制定了 SQL 标准。ANSI 是一个美国工业和商业集团组织,发展美国的商务和通讯标准。ANSI 同时也是 ISO 和 Internation
32、al Electrotechnical Commission(IEC)的成员之一。ANSI 发布与国际标准组织相应的美国标准。1992年,ISO 和 IEC 发布了 SQL 的国际标准,称为 SQL-92。ANSI 随之发布的相应标准是 ANSI SQL-92。ANSI SQL-92 有时被称为 ANSI SQL。尽管不同的关联式资料库使用的 SQL 版本有一些差异,但大多数都遵循 ANSI SQL 标准。SQL Server 使用 ANSI SQL-92 的扩展集,称为 T-SQL,其遵循 ANSI 制定的 SQL-92 标准。SQL 2000作为微软在Windows 系列平台上开发的数据库
33、,一经推出就以其易用性得到了很多用户的青睐,相信大多数将自己的业务建立在Windows平台上的用户都会对它有相当的亲切感。区别于FoxPro、Sql 2000小型数据库,SQL 2000是一个功能完备的数据库管理系统。它包括支持开发的引擎、标准的SQL语言、扩展的特性(如复制、OLAP、分析)等功能。而像存储过程、触发器等特性,也是大型数据库才拥有的。2.4.2数据库的基本概念当人们从不同的角度来描述这一概念时就有不同的定义(当然是描述性的)。例如,称数据库是一个“记录保存系统”(该定义强调了数据库是若干记录的集合)。又如称数据库是“人们为解决特定的任务,以一定的组织方式存储在一起的相关的数据
34、的集合”(该定义侧重于数据的组织)。更有甚者称数据库是“一个数据仓库”。当然,这种说法虽然形象,但并不严谨。 严格地说,数据库是“按照数据结构来组织、存储和管理数据的仓库”。在经济管理的日常工作中,常常需要把某些相关的数据放进这样的“仓库”,并根据管理的需要进行相应的处理。例如,企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表中,这张表就可以看成是一个数据库。有了这个数据仓库我们就可以根据需要随时查询某职工的基本情况,也可以查询工资在某个范围内的职工人数等等。这些工作如果都能在计算机上自动进行,那我们的人事管理就可以达到极高的水平。此
35、外,在财务管理、仓库管理、生产管理中也需要建立众多的这种数据库,使其可以利用计算机实现财务、仓库、生产的自动化管理。 J.Martin给数据库下了一个比较完整的定义:数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务;数据的存储独立于使用它的程序;对数据库插入新数据,修改和检索原有数据均能按一种公用的和可控制的方式进行。当某个系统中存在结构上完全分开的若干个数据库时,则该系统包含一个“数据库集合”。2.4.3数据库的类型数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。而不同的数据库是按不同的数据结构来联系和组织的。1.数据结构模型(1)
36、数据结构所谓数据结构是指数据的组织形式或数据之间的联系。如果用D表示数据,用R表示数据对象之间存在的关系集合,则将DS(D,R)称为数据结构。例如,设有一个电话号码簿,它记录了n个人的名字和相应的电话号码。为了方便地查找某人的电话号码,将人名和号码按字典顺序排列,并在名字的后面跟随着对应的电话号码。这样,若要查找某人的电话号码(假定他的名字的第一个字母是Y),那么只须查找以Y开头的那些名字就可以了。该例中,数据的集合D就是人名和电话号码,它们之间的联系R就是按字典顺序的排列,其相应的数据结构就是DS(D,R),即一个数组。(2)数据结构种类 数据结构又分为数据的逻辑结构和数据的物理结构。数据的
37、逻辑结构是从逻辑的角度(即数据间的联系和组织方式)来观察数据,分析数据,与数据的存储位置无关。数据的物理结构是指数据在计算机中存放的结构,即数据的逻辑结构在计算机中的实现形式,所以物理结构也被称为存储结构。这里只研究数据的逻辑结构,并将反映和实现数据联系的方法称为数据模型。目前,比较流行的数据模型有三种,即按图论理论建立的层次结构模型和网状结构模型以及按关系理论建立的关系结构模型。2.层次、网状和关系数据库系统(1)层次结构模型层次结构模型实质上是一种有根结点的定向有序树(在数学中树被定义为一个无回的连通图)。下图是一个高等学校的组织结构图。这个组织结构图像一棵树,校部就是树根(称为根结点),
38、各系、专业、教师、学生等为枝点(称为结点),树根与枝点之间的联系称为边,树根与边之比为1:N,即树根只有一个,树枝有N个。按照层次模型建立的数据库系统称为层次模型数据库系统。IMS(Information Manage-mentSystem)是其典型代表。(2)网状结构模型按照网状数据结构建立的数据库系统称为网状数据库系统,其典型代表是DBTG(Data Base Task Group)。用数学方法可将网状数据结构转化为层次数据结构。(3)关系结构模型关系式数据结构把一些复杂的数据结构归结为简单的二元关系(即二维表格形式)。例如某单位的职工关系就是一个二元关系。由关系数据结构组成的数据库系统被
39、称为关系数据库系统。在关系数据库中,对数据的操作几乎全部建立在一个或多个关系表格上,通过对这些关系表格的分类、合并、连接或选取等运算来实现数据的管理。dBASEII就是这类数据库管理系统的典型代表。对于一个实际的应用问题(如人事管理问题),有时需要多个关系才能实现。用dBASEII建立起来的一个关系称为一个数据库(或称数据库文件),而把对应多个关系建立起来的多个数据库称为数据库系统。dBASEII的另一个重要功能是通过建立命令文件来实现对数据库的使用和管理,对于一个数据库系统相应的命令序列文件,称为该数据库的应用系统。因此,可以概括地说,一个关系称为一个数据库,若干个数据库可以构成一个数据库系
40、统。数据库系统可以派生出各种不同类型的辅助文件和建立它的应用系统。2.4.4数据库系统的结构不同的数据库系统有着不同的系统结构,毫无疑问,一个数据库结构并不能完全用于所有的数据库系统,在这里我们以被广泛认同的数据库结构ANSI/SPARC结构来进行说明。1. ANSI/SPARC结构在ANSI/SPARC结构中将数据库分为内部层(Internal Level)、概念层(Conceptual Level)以及外部层(External Level)等三层,如图2-1所示。图2-1 数据库结构图内部层是最接近数据库实体存储位置的一层,与数据库数据实际存储方式有关,在内部层中以具体的方式来表示整个数据
41、库。外部层是最接近用户的部分,与用户对数据的查看方式有关,在外部层中以用户看得懂的方式来表示部分数据库的内容,每个用户所查看的数据内容不同。概念层位于内部层与外部层之间,以用户看得懂的方式来表示整个数据库,提供每个用户一致的数据查看内容。不管是使用哪一种数据库系统,都只会影响到ANSI/SPARC结构的外部层以及概念层内容,而与内部层无关。例如,对于关系型数据库系统而言,在概念层中所看到的数据一定是以关系型的形式存在,在外部视域中所看的数据有可能会以关系型的形式存在,至于在内部层中的数据则一定不会是以关系型的形式存在。2. Mapping对应在图2-2的详细结构图中,可以发现在内部层与概念层之
42、间以及概念层与外部层之间各有一个对应(Mapping)存在,分别对应着上下两层的内容。图2-2 数据库详细结构图概念/内部对应(Conceptual/ Internal Mapping)位于概念层与内部层之间,定义数据库的概念视域内容与实际存储内容之间的对应关系。如果改变了数据库的存储结构,只要在这个对应中修改对应的内容就可以了,而不需要改变概念视域与外部视域的内容。外部/概念对应(external/conceptual mapping)位于外部层与概念层之间,定义特定外部视域与概念视域的对应关系,也就是定义外部视域所查看的部分数据库内容与整个数据库之间的关系。2.5HTML简介HTML(Hy
43、per Text Mark-up Language)即超文本标记语言或超文本链接标示语言,是目前网络上应用最为广泛的语言,也是构成网页文档的主要语言。HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等。HTML的结构包括头部(Head)、主体(Body)两大部分,其中头部描述浏览器所需的信息,而主体则包含所要说明的具体内容。HTML只不过是组合成一个文本文件的一系列标签。它们像乐队的指挥,告诉乐手们哪里需要停顿,哪里需要激昂。HTML标签通常是英文词汇的全称(如块引用:blockquote)或缩略语(如“p”代表Paragraph),但它们的
44、与一般文本有区别,因为它们放在单书名号里,如Paragragh标签是,块引用标签是。有些标签说明页面如何被格式化,例如开始一个新段落。其他则说明这些词如何显示,如表示加粗。还有一些其他标签提供在页面上不显示的信息,例如标题。关于标签,需要记住的是,它们是成双出现的。每当使用一个标签,如,则必须以另一个标签将它关闭。注意“blockquote”前的斜杠,那就是关闭标签与打开标签的区别。 但是也有一些标签例外,如标签就不需要。基本HTML页面以DOCTYPE开始,它声明文档的类型,且它之前不能有任何内容(包括换行符和空格),否则将使文档声明无效。接着是标签,以结束。在它们之间,整个页面有标题和正文
45、两部分。标题词夹在和标签之间这个词语在打开页面时出现在屏幕底部最小化的窗口。正文则夹在和之间即所有页面的内容所在。页面上显示的任何东西都包含在这两个标签之中。2.5.1HTML的特点和好处HTML文档制作不是很复杂,且功能强大,支持不同数据格式的文件镶入,这也是WWW盛行的原因之一,其主要特点如下:l 简易性:HTML版本升级采用超集方式,从而更加灵活方便。l 可扩展性:HTML语言的广泛应用带来了加强功能,增加标识符等要求,HTML采取子类元素的方式,为系统扩展带来保证。l 平台无关性:虽然PC机大行其道,但使用MAC等其他机器的大有人在,HTML可以使用在广泛的平台上,这也是WWW盛行的另一个原因。2.5.2HTML文档结构HTML文档(即Homepage的源文件)是一个放置了标记的ASCII文本文件,通常它带有.html或.htm的文件扩展名。生成一个HTML文档主要有以下三种途径: