基于Trip数据库的档案管理系统的设计与实现.doc

上传人:文库蛋蛋多 文档编号:4015939 上传时间:2023-04-01 格式:DOC 页数:5 大小:430.50KB
返回 下载 相关 举报
基于Trip数据库的档案管理系统的设计与实现.doc_第1页
第1页 / 共5页
基于Trip数据库的档案管理系统的设计与实现.doc_第2页
第2页 / 共5页
基于Trip数据库的档案管理系统的设计与实现.doc_第3页
第3页 / 共5页
基于Trip数据库的档案管理系统的设计与实现.doc_第4页
第4页 / 共5页
基于Trip数据库的档案管理系统的设计与实现.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《基于Trip数据库的档案管理系统的设计与实现.doc》由会员分享,可在线阅读,更多相关《基于Trip数据库的档案管理系统的设计与实现.doc(5页珍藏版)》请在三一办公上搜索。

1、第 卷第 期 年 月中原工学院学报 ,文章编号:()基于 数据库的档案管理系统的设计与实现程传鹏(中原工学院,郑州 )摘 要: 结合 数据库在处理非规范性文档方面的优势,设计出了一种基于 数据库的档案入库系统,实现了纸质档案的电子存储,为电子文档内容的直接检索做好了前期工作实验结果表明,本系统提高了数据存储空间的利用率关 键 词: 非规范性数据;档案管理;数据库;文本提取中图分类号: 文献标志码: :随着计算机无纸办公技术应用的普及,各种格式的电子文件 资 料 大 量 涌 现,不 仅 有 文 字 资 料,还 有 声 音、图像、动画、视频等等这些文档结构无定、类型 各异、规格不一、长度参差,不能

2、直接转化成关系数据 库的字段信息,因而不能被传统的关系型数据库管理 系统有效地处理,大大降低了这些数据的使用价值据 统计,诸如此类的非规范性数据信息占了互联网上数 据的 传统 的 关 系 型 数 据 库 由 于 自 身 的 局 限 性, 已经远远不 能 满 足 今 天 非 规 范 性 数 据 快 速 增 长 的 需 要为了解决关系数据库在非规范性数据处理上的不 足, 年瑞典 公司在皇家工学 院 的 图 书 情 报检索专用软件 基础上,开发出了专为处理非规 范性数据的软件系统 系统本文分析了 数 据库在处理非规范性电子文档上的优势,并在此基础 上,利用 数据库设计出了一种电子文档管理系统由字段组

3、成,每一个字段容许存放任意多个实体子字段自动带有编 号,彼 此 相 互 独 立 记 录 的 字 段 长 度不限,设计数据库字段时不需预定其大小关系型数 据库的字段长度在设计数据库时必须设定,装库时如 果数据内容不够量,它就不会“省”出没用完的空间,而 数据多于设定 值 时,超 过 部 分 又 没 法 存 进 去 是 多维结构的数据库,比较适合于大量不定长数据的存 储数据库 是 面 向 大 数 据 对 象 设 计 开 发 的,数 据 库文件只由 个文件组成,分别是数据文件 、检索词文件 和词根文件 ,因此数据库的 存储、复制、查询、维护都很方便对于数据量以“百万字节”计的多媒体信息的存储而言,是

4、很好的选择此外,可 随 时 追 加 新 字 段如 首 次 设 计 数 据 库时建立了 个字段,使用一段时间后要增加 个字 段,这时只需加上这 个字段即可,已有记录中的数据 照常使用而关 系 型 数 据 库 则 做 不 到 是 管 理 存 储各种电子文档资料的最佳解决方案,它有一种专门 存储二进制数据的字段,不仅能存储多达 多种不 同格式 的 电 子 文 件,如 、 、等,而且 能 自 动 抽 取 这 些 文 件 之 中 的 文 字信息,形成倒排文件,供人们进行全文内容的快速查 找在处理非 规 范 性 数 据 方 面,尤 其 是 当 前 普 遍 面 临 在处理非规范性数据方面的优势目前的档案管理

5、系统大都是基于关系数据库的,但关系型数据库是二维平面结构,表的一行表示一个 记录,表的一列代表记录中的一个字段,一个字段只允 许 放 一 个 实 体 是 多 维 结 构 的 数 据 库 系 统 ,记 录文、图、音、视 信 息 等 大 量 多 媒 体 信 息 管 理 的 情 况 下,要比关系型数据库强很多收稿日期:作者简介:程传鹏()男,河南信阳人,讲师,硕士机能够存储的数字化成果,即对所有未数字化的档案进行扫描,整理其属性信息,并进行数据存储,最终为 数字化档案提供安全高效的管理方法,从而取代现有 的管理方式档案管理系统结构如图 所示档案管理系统主要实现如下 个方面的功能:()档 案 扫 描

6、改 变 了 传 统 的 用 扫 描 仪 扫 描 档 案系统分析及设计系统目标档案数据库管理,首先要将纸质档案转变为计算图档案管理系统结构图的方法,采用系统控制高速扫描仪方式进行扫描,既保证了扫描档案的质量,又显著提高了工作效率并且档 案扫描后直接自动存人数据库内,改变了传统的人工 手动入库工作量大、速度慢的缺点()数据建 库不 同 时 期 的 档 案,管 理 方 式 不 同,因此对其进行分开存储和管理为维护数据的实时性,系统提供对数据库的维护与更新功能()文本信息提取对 存 入 数 据 库 的 二 进 制 文 件 进行文本提取,提取后的文本信息同样也保存在数据 库里,为后续的基于电子文档内容的

7、信息检索做好前 期工作()用户管理通过 角 色 和 活 动 的 权 限 来 进 行 统一的管理根据业务分工,将系统的管理权限和角色关 联,即角色的权限只定义和系统模块相关联的权限,通 过角色权限的管理,控制用户对系统的入库、编辑、查 询、删除、打印等权限设计数据库时,可以事先准备好一个数据库 定义文本文件 ,通 过 系 统 提 供 的命令,在命令窗里直接生成数据库结构: 数据库定义文件 的格式如下:(: (), )其中,指的是字段名,最长 个英文字符,后用“:”; 指 的 是 字 段 号,用 数 字 表 示; 指的是字段类型; 指的是不需要倒排,需要倒排时,为空白;()指 的 是 字 段 说

8、明,说 明 性 文 字 放在圆括号内本系统中最重要的数据库 有 个:一个是文档数 据库,一个是用户数据库与文字数据不同,当一个电子文件存放在 数 据库记录中时,需 个字段来描述第一个字段定义为 字段,用来存 放 文 件 名;第 二 个 字 段 定 义 为 字段,用来存放全部文件内容的信息;第三个字 段定义为字段,用来存放文件大小的数值;第 四个字段定 义 为 字 段,用 来 存 放 从 原 格 式 文 件 抽取出来的文字内容文档数据库定义文件的格式如下:数据库设计的数据 库 由 记 录 组 成,记 录 又 由 字 段 组 成 记录中的字段可容纳 种不同类型的信息,包括 、其 中,类型可以存放二

9、进制信息,记录中字段的个 数不限除正文、字串数据类型外,其他类型字段下分 子字 段 (),正 文 类 型 字 段 下 分 段 落 ( ),段落之中又分句子(),句子之中又分 词()字段中子字段的数量也是没限制的中原工学院学报 年 第 卷 许多控件,在 这 些 控 件 中 选 择 图 像 扫 描 控 件,(:(), : (), : (), : ()本系统有 类用户:系统管理员、数据管理员和普通用户系统管理员的用户名为,他有最高系统权 限,只 有 他 才 可 创 建 数 据 管 理 员 ( )、用 户 经 理()系统管理员本身也是 和 ,有建立数据 库和开设新用户的权限 有权建造数据库,并授权 给

10、用户或用户组去访问该数据库只有经他授权的用 户(包括创建文件经理的系统管理员)才能使用他创建 的数 据 库 有 权 建 立 新 的 用 户 或 用 户 组一 个 系统可以有不限量的 或 用户数 据 库 定 义 文 件 的 格 式 如下:(: (): (),再单击键,即完成添加任务此时在 中可以看到 新 添 加 的 类,查 看 类 的 源 文 件 ,可 深 入 了 解 该 控 件 的 属 性 和 使 用 方 法通过 的 ,添加类型 为 的成 员 变 量 ,在 对 话 框 上 添 加 “开始 扫 描 ”按 钮 控 件,设 置 该 按 钮 控 件 的 为 然后,在工程中加入如下代码: ()(!()

11、(“扫描仪打开失败”): ():)() (“扫描仪打开失败”): ():()(“扫描仪打开失败”):():):(),: : :数据库的连接产品族提供了一个进程内的 组 件 ,通过调用 组 件,可 以 完 成 对 数 据 库 的 添 加、删除、查找等一些基本操作为了在程序中使用 组件,首先需要安装 组件,并自动完成 组件的注册在 程序的头文件中添加语 句 ,以 引 入 组 件,并 在 在 函 数 ()中对 环境初始化,语句如下: ()为了在程序中使用 数据库,需要先连接数据 库,步骤如下:()在 头 文 件 中 声 明 ;()通过以下的语句来创造会话对象实例: ( );()连接数据库,语句如下:

12、系统关键技术的实现扫描仪的控制首先,在 中新建一个 ()项目文件,在 第一步中选择 基于对 话 框 项,第 二 项 中 选 择 复 选 框,其他缺省这样建立了一个以对话框为主窗口的应 用程序然后,在 中新建对话框,将该 对话 框 的 改 为,将 对 话框的 设置为在 主 菜 单 中 单 击 【】【 】 【 】【】命 令,在 对 话 框 中 将 出 现 ( , , , , ,);( ) 通 过 定 义 的 引 用,返回会话变量二进制文件的存储要把二进制 文 件 上 传 到 数 据 库,需 要 用 到 函数,其语法格式如下:( , , , )其中各参数的意义如下:文件名,包括路径; :存放所抽取文

13、本的字段名称; :选项; :标志,一般为空这个函数不仅能上载文件,而且能提取文档中的文本字符程序中上载文件的代码如下: ; (); () (图添加 控件图()单击工具箱上的 控件,将此控件添加到 对 话 框 上,然 后 在 对 话 框 的 头 文 件 中 声 明 对象:;()如果要显示磁盘上的文件,则需要用到 方法,代码如下:()其中,指的是包含完整磁盘路径的文件名如果要显示存放在数据库字段中的文件,则用如 下代码: ; (), , ();, );() (), , );();文件的显示产品族提供的 组件是一种文档检 索管理组件,它能将 多种不同格式的电子文档存 放在 的数据库之中,同时自动抽取

14、其中的文字内 容建立倒排文件,供用户快速查看,最终显示出和原有 文档完全相同的视图在程序中实现文档预览的步骤如下:()安 装 ,同 时 系 统 自 动 完 成 控件的注册;()单 击 【】 【 】 【】,打开【】对话框,如图 所示;()选择【 】文件夹中 的【】,单击【】,将 控件添加到工程中;实验为了比较 数据库和关 系 数 据 库 在 处 理 电 子文档方面的优劣,本文选择了 份纸质文档,经过扫 描仪扫描后,形成 文件,文件大小为 分 别采用 数据库和目前流行的 关 系数据库对这些 文件进行存储和检索分别从二 进制文件的存储、文档的预览、电子文档的信息提取等方面以及存储空间的利用率、检索时

15、间指标进行比较,结果如表 所示中原工学院学报 年 第 卷 表关系数据库和 数据库的比较能否存取二进制文件比较指标能否显示源文档能否提取文字存储空间利用率平均检索时间数据库关系数据库高短低长其中存储空间利用率按如下公式计算: 文件大小结语存储空间利用率 数据库磁盘文件大小以不同的关键字进行 次检索,以这些检索时间的平均值作为平均检索时间,计算公式如下:本文针对电子文档的特点,利用 数据库在处理电子文档上的优势,设计出了一种基于 数据库 的的电子文档管理系统实验结果 表 明,采 用 数 据库来处理电子文档,不仅能提高存储空间的利用效 率,而且检索效率也要优于传统的关系数据库在以后 的工作中,我们将利用 所提供的 功 能,来 提 取 电 子文档中的文本信息,为下一步对电子文档内容的直 接检索创造条件 从 表可以看出,虽然二者都能存储二进制文件,但是关系数据库不能预览文档,也不能提取电子文档 中的文字信息,并且关系数据库的存储效率和检索时 间都要劣于 数据库参考文献:陈振宇全文数据库 在知识管理系统中的应北京:北京邮电大学,王伟 数据库系统的优势安徽科技,(): 王振兴,杨敏华,吴勰,等档案扫描入库管理系统设计与实现测绘科,(): 游明星 中利用图像扫描控件控制扫描仪电脑编程技巧与维护,(): (,): , : ;

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号