TRSGateway 全文检索数据网关用户手册.doc

上传人:laozhun 文档编号:4241185 上传时间:2023-04-10 格式:DOC 页数:128 大小:1.99MB
返回 下载 相关 举报
TRSGateway 全文检索数据网关用户手册.doc_第1页
第1页 / 共128页
TRSGateway 全文检索数据网关用户手册.doc_第2页
第2页 / 共128页
TRSGateway 全文检索数据网关用户手册.doc_第3页
第3页 / 共128页
TRSGateway 全文检索数据网关用户手册.doc_第4页
第4页 / 共128页
TRSGateway 全文检索数据网关用户手册.doc_第5页
第5页 / 共128页
点击查看更多>>
资源描述

《TRSGateway 全文检索数据网关用户手册.doc》由会员分享,可在线阅读,更多相关《TRSGateway 全文检索数据网关用户手册.doc(128页珍藏版)》请在三一办公上搜索。

1、 全文检索数据网关用 户 手 册版本:v2.0 Build1015北京拓尔思(TRS)信息技术有限公司版权说明本手册由北京拓尔思(TRS)信息技术有限公司(以下简称TRS公司)出版,版权属TRS公司所有。未经出版者正式书面许可,不得以任何方式复制本文档的部分或全部内容。北京拓尔思(TRS)信息技术有限公司 版权所有。保留所有权利。 是北京拓尔思(TRS)信息技术有限公司的注册商标目 录关于本手册1读者1手册组织1相关手册1用户反馈意见1联系地址1第一章 TRS数据网关系统介绍41.1 概述41.2 主要特点41.3 系统需求51.4 产品新增功能5第二章 TRS数据网关的安装62.1 安装介质

2、62.2 安装需求62.3 安装过程72.4 安装结果72.5 系统卸载7第三章 使用说明83.1 启动界面83.2 版本升级173.3 任务的导入183.4 任务的导出193.5 任务的视图203.6 创建任务213.6.1 创建“RDBMS=TRS”任务213.6.2 创建“TRS=RDBMS”任务343.6.3 创建“TRS格式文件=RDBMS”任务443.6.4 创建“RDBMS=RDBMS”任务563.6.5创建“TRS格式文件=TRS”任务663.6.6 创建“优化TRS数据库”任务763.6.7 创建“RDBMS=TRS格式文件”任务793.7 查看和修改任务属性913.7.1

3、常规属性913.7.2 字段匹配943.7.3 任务的定时953.7.4 FTP参数的设置963.8 执行任务973.8.1任务的排序973.8.2 查看工作日志983.8.3 查看执行信息993.8.4 删除执行信息993.9运行监控99附录1 字段对应表1021.1 RDBMS和TRS字段对应表1021.1.1 ORACLE和TRS的字段对应表1021.1.2 SQL SERVER和TRS的字段对应1031.1.3 SYBASE和TRS的字段对应1051.1.4 DB2和TRS的字段对应1061.1.5 INFORMIX和TRS的字段对应107附录2 RDBMS客户端配置1092.1 OR

4、ACLE客户端的配置1092.2 SQL SERVER客户端的配置1132.3 SYBASE的客户端配置1142.4 DB2的客户端配置1152.5 INFORMIX的客户端配置117附录3 常见问题解答1203.1安装1203.1.1安装TRS数据网关有何要求1203.1.2如何升级TRS数据网关1203.1.3 TRS数据网关对ORACLE的哪些版本提供支持1213.1.4 TRS数据网关对SQL SERVER的哪些版本提供支持1213.1.5 TRS数据网关对SYBASE的哪些版本提供支持1223.1.6 TRS数据网关对DB2的哪些版本提供支持1233.1.7 TRS数据网关对info

5、rmix的哪些版本提供支持1233.2创建任务1233.2.1如何创建RDBMS视图到TRS数据库的增量更新任务1233.2.2如何创建过滤大对象文本的任务1253.2.3如何创建字符集转换的任务1263.2.4如何创建指定字符型字段保存URL的任务1263.2.5如何在创建任务时选择保存大对象文本还是原格式文件1273.3运行任务1293.3.1运行大数据量的RDBMS任务时有什么需要注意的1293.3.2 RDBMS任务组的任务运行过程中突然没有反映了怎么办1293.3.3运行多个TRS格式文件到RDBMS任务时任务中断怎么办1303.3.4运行TRS=RDBMS任务中TRS数据库中包含多

6、值字段怎么办1303.4管理任务1303.4.1取消版本转换窗口后如何恢复130关于本手册本手册介绍的主要内容可以分为四部分。第一部分为系统概述;第二部分是安装指南;第三部分为使用说明;第四部分为附录。读者本手册的读者为TRS和RDBMS的使用者。手册组织 本手册的内容组织如下 第一章 TRS数据网关功能概述 介绍TRS数据网关。 第二章 安装 详细描述TRS数据网关。第三章 使用说明 详细描述TRS数据网关。相关手册 TRS数据网关联机手册用户反馈意见TRS公司感谢您使用TRS 产品。如果您发现本手册中有错误或者产品运行不正确,或者您对本手册有任何意见和建议,请及时与TRS公司联系。您的意见

7、将是我们做版本修订时的重要依据。联系地址 TRS总部营销服务中心:北京市海淀区花园东路10号高德大厦401室邮编:100083电话:010-82038858传真:010-82038878Email:info产品研发中心:北京 北四环中路35号健翔桥 北京信息工程学院图书馆三层邮编:100101电话:010-64859900 传真:010-64879084 Email:trs 上海分公司上海市成都北路333号 招商局广场南楼1505室邮编:200041电话:021-52981607/08传真:021-32013912Email:trs.sh 广州分公司广州市先烈路76号 中侨大厦16层H室邮编:

8、510070电话:020-87320136传真:020-87320141Email:trs.gz 成都办事处 成都市洗面桥街29号四川咨询产业大厦1309室邮编:610041电话:028-85533146传真:028-85533516Email:trs.cd 湖南代表处 湖南省长沙市韶山北路81号君临天厦605室邮编:410011电话:0731-4126388Email:trs.hnWebsite:第一章 TRS数据网关系统介绍1.1 概述TRS全文检索数据网关(以下简称TRS数据网关)是由TRS信息技术有限公司和五大关系型数据库厂商ORACLE、SYBASE、IBM、 INFORMIX、MI

9、CROSOFT鼎力合作,推出的实现TRS数据与主流关系型数据库Oracle, Sybase, DB2, Informix, SQL Server(以下统称为RDBMS)数据之间进行双向数据迁移的工具。该工具实现了RDBMS与TRS服务器之间数据共享,使用户在享有RDBMS卓越的数据处理功能的同时,拥有TRS优秀的全文检索功能。TRS数据网关由以下两部分组成:l TRS任务监理控制台l 分别对应Oracle, Sybase, DB2, Informix, SQL Server的TRS*RDBMS任务组件TRS任务监理控制台是运行在Windows平台上的高度自动化、智能化和定制化的任务处理工具,它

10、可以独立运行一个RDBMS任务组件,也可以同时运行多个RDBMS任务组件。它与RDBMS任务组件共同完成: RDMBS与TRS数据库之间数据迁移 TRS格式文件与RDBMS/TRS之间的数据迁移 RDBMS与RDBMS数据库之间的数据迁移 TRS数据库的优化 以上各种数据迁移与优化任务的管理、维护和定时执行1.2 主要特点TRS for RDBMS Gateway系列软件是辅助完成数据索引同步更新的自动化工具,它具有如下特点:l 自动化程度高:用户只需要按步跟随“任务创建向导”的提示就可以创建更新任务。l 可设置的定时执行任务:对创建好的任务,用户可以设置其自动定时执行。如:用户可以设置一个增

11、量更新任务每隔30分钟执行一次,意即每隔30分钟将用户对RDBMS数据库表中数据的修改向TRS数据库中进行一次索引的更新。高度自动化的定时执行功能使用户不必手动进行数据索引的更新操作,只需启动TRS*Agent即可自动定时执行。l 实时查看和修改任务的各种属性:对任何一个创建好的任务,用户可以查看其属性,并可修改属性。美观友好的界面风格:界面友好,简单易用。1.3 系统需求应用程序运行的硬件环境要求: CPU: 主频 200MH(主频越高性能越好)。 内存: 256M 硬盘:请确保系统临时目录的可用空间在500MB以上。 CDROM: 16X以上的光盘驱动器。应用程序运行的软件环境要求: 操作

12、系统:Windows NT 4.0 +sp6/2000 + sp2软件环境:安装相应关系数据库的客户端工具。1.4 产品新增功能Trsagent 是TRS for RDBMS Gateway系列软件的最新版本,版本号为2.0。它相对于1.0版有很大的改进,修正了1.0版中的Bug,还增加了一些新的功能,在1.0版中,成功的实现了数据从RDBMSTRS的数据同步和更新。在2.0中不仅增加了数据从TRSRDBMS的数据迁移(包括TRS数据库RDBMS和TRS格式的文件RDBMS)功能,还增加了数据RDBMS=RDBMS迁移,实现RDBMS数据库表或视图内部的数据迁移,为用户实现视图到表的转换,从而

13、为提高性能提供一种可能,除了这些,数据更新的方式增加了追加更新。这些功能的增加,是您在享有各种主要RDBMS卓越的数据处理功能的同时,拥有TRS优秀的全文检索功能。第二章 TRS数据网关的安装2.1 安装介质安装介质分为两部分TRS Gateway控制台和TRS*RDBMS组件。TRS*RDBMS组件包括:ORACLE、SQL SERVER、SYBASE、DB2、INFORMIX。2.2 安装需求安装TRS数据网关需要满足以下软件条件: 安装TRS数据网关控制台(必须) 安装TRS*RDBMS的数据库组件(必须) 安装与TRS*RDBMS数据库组件相同的数据库客户端(必须) 安装IE 4.0以

14、上浏览器(浏览联机帮助所必须) 在运行ORACLE SERVER的计算机上安装FTP服务器(取决于处理数据的条件) 安装TRS数据网关需要满足以下硬件条件: CPU:主频 200MH(主频越高性能越好)。 内存: 256M 硬盘:安装目录的可用空间:10M (如果您需要保留出错日志,还需要更多的硬盘空间) 系统临时目录可用空间:500M。 CDROM: 16X以上的光盘驱动器。2.3 安装过程首先安装TRS Gateway控制台,直接运行Setup.exe即可,在安装过程中只需指定安装路径即可,系统缺省的安装路径为d:TRS4TRSGateway。接着可以选择安装需要的RDBMS组件。2.4

15、安装结果在开始菜单中有Gateway控制台的快捷方式可以直接运行程序。2.5 系统卸载因为控制台和相应组件相互独立,所以可以独立卸载。选择开始菜单栏中的TRS信息检索栏下的卸载TRS (RDBMS)任务组件可以单独删除相对应的RDBMS任务组件,或选择卸载TRS Gateway控制台可以删除控制台和所有组件。第三章 使用说明3.1 启动界面启动TRS数据网关控制台后,系统将自动检测您的机器上是否存在有效的版本1.0的任务,如果存在,将提示您进行版本转换。TRS数据网关控制台的界面由以下几部分组成:1,菜单: 任务菜单任务菜单包括以下功能:新建、执行、中断执行、删除、重命名、属性和退出。其中新建

16、功能,在任务组为RDBMS时支持四种任务的创建:RDBMS=TRS;TRS=RDBMS;TRS格式文件=RDBMS;RDBMS=RDBMS。任务组为TRS时支持两种任务的创建:TRS格式文件=TRS和优化TRS数据库。执行任务包括:立即执行和定时执行。 查看菜单查看菜单包括以下四种功能:查看(任务)、查看工作日志、显示执行信息和删除执行信息。 帮助菜单帮助菜单包括:目录和索引、关于本产品。 系统设置菜单系统设置菜单包括:进程文件设置、启动监控进程、关闭监控进程、文本合并、字段合并、任务附加属性这个菜单是在后台启动一个进程监控程序对Gateway进行监控。(1)、进程文件设置:进入这个菜单将会弹

17、出如下的对话框:A、TRS Gateway可执行程序的全路径就是TrsAgent.exe所在的全路径,包含TrsAgent.exe。如果用户安装在D:TRS4Gateway下,那么全路径是:D:TRS4GatewayTrsAgent.exeB、重启TRS Gateway的时间间隔(单位:天),就是确定多长时间把TRS Gateway重新启动,如果设置为0天,那么监控进程不对Gateway进行监控。多数增量更新情况下,这个值可设为110,如果是执行完全更新,则设为0。C、监控进程的监控时间间隔(单位:秒)就是监控进程多长时间对Gateway进行一次监控(就是扫描一次Gateway的状态)。这个时

18、间多设为10(不允许为0)。D、重新启动TRS Gateway的时刻就是用户要指定在那一个时间点上重新启动TRS Gateway。如果在B中的值设为5,这是此项设为20:00:00,将表示在五天之后的20:00:00分重新启动TRS Gateway。E、重新启动系统就是重新启动Windows系统,这个项我们强烈建议用户不要设置。(2)、启动监控进程: 启动一个后台的按照配置的监控进程,使之能对指定的进程进行监控。(3)、关闭监控进程: 关闭一个后台的按照配置的监控进程,使之不能对指定的进程进行监控。(4)、文本合并: 文本合并主要只针对多值的情况下进行相关的大对象中文本合并到一个TRS的Doc

19、ument类型字段中的过程。这种情况会在诸如一个作者对应多个文章的情况中,而TRS的Document类型是不支持多值的,为此当需要对所有的文章进行全文检索时,就需要文本合并。 进入文本合并菜单,将弹出如下对话框: 选择其中的数据库种类,如果在已经创建的任务中存在多值,将会出现如下的信息:可以选择那些任务必须合并文本,那些不用合并文本。选择合并文本的任务,其注解将变为:“多值文本合并”。注意,系统缺省默认都是不合并文本的。注意:目前版本下,Oracle和Sybase还是没有提供这个功能。(5)字段合并:字段合并是解决在某些情况下,需要把多个字段的值合并到一个字段中的功能。选择后将会弹出如下的对话

20、框:选择任务类型后选择任务名,显示下图:只要单击合并设置中某一行,就会显示弹出可选合并的源字段名,如图:例子中,分别“WINHEIGHT、DOCKEYWORDS、DOCORDER”等三个字段合并到DOCRELWORDS中,如图:(6)任务附加属性:任务附加属性主要是设置Gateway在进行某个任务时,中间缓存数据的路径。这样可以更方便用户维护。存在“逐个设置”和“一次全部设置”两个设置项,“逐个设置”就是一个一个地设置任务。“一次全部设置”则是一次性地对所有任务进行设置。当选“一次全部设置”时将会弹出路径选择狂,如下图:选定目录后,按下“确定”,将会出现如下的效果:例子是选择“H:incomi

21、ng”做缓冲路径。如果是选择“逐个设置”,则必须单选某个任务后才能弹出选择路径的对话框。如图:对任务“FULL_FTPDIR1”选择了“D:Download”作为缓冲目录。2,工具条 工具条上包含了新建、查看任务、执行、中断执行、删除、重命名、属性、查看工作日志、删除工作日志和帮助九个按钮。其中新建按钮可以打开一下拉菜单提供六种任务的创建。3,窗口 左上部:任务组窗口任务组窗口反映的是当前控制台支持的有效的数据库组件,其中在最多的情况下,任务组窗口将包含六个组件:ORACLE,SQL SERVER,DB2,SYBASE,INFORMIX和TRS。任何时候有且只有一个任务组为选中状态,选中任务组

22、图标为彩色显示,其他的为灰色显示。 右上部:任务窗口任务窗口是一用来显示当前已创建任务信息的列表窗口,该列表在任务组为RDBMS时共有八列:定时、任务类型、任务名、源数据、目标数据、下次运行时间、创建时间和描述;当任务组为TRS时,列表为七列:定时、任务类型、任务名、目标数据、下次运行时间、创建时间和描述。对任务一列,点击该列的列表头均可以实现对当前任务组的所有任务按该列的升/降排序。用户可以通过选择查看任务的方式,查看所有任务或指定的某一任务类型的任务。缺省情况下,为查看所有任务。 下部:执行信息窗口执行信息窗口是反映了当前任务组指定任务的历次执行信息。该窗口可以显现或隐含,点击“查看”菜单

23、的“显示执行信息”或工具条上的“显示执行信息”按钮将控制该窗口的显隐状态。点击“查看”菜单中的“删除执行信息”项将当前任务组的所有执行信息全部清空。 3.2 版本升级启动TRS数据网关控制台后,系统将自动检测是否需要进行版本升级,如果同时满足以下条件,系统将弹出版本转换对话框:1. 您的机器上存在有效的版本1.0的任务;一个有效的TRS数据网关 1.0的任务是指: o 由V1生成的非优化TRS数据库的任务, o 且V2安装了与对应任务相关数据库组件。 2. 您上一次使用“版本升级”功能时,未选择“下次启动不再显示本窗口”选项。 版本转换对话框包括的选项有: 将版本V1的任务升级到V2,同时保留

24、V1的任务。(该种情况为缺省选择) 将版本V1的任务升级到V2,删除V1已经完成转换的任务。 不做版本升级。 下次启动时不再显示本窗口。该选项将封闭版本转换功能,如果您在封闭版本转换功能后确实还需要再次进行版本转换,请将您系统目录下./WINNT/win.ini文件中的以下信息修改为:TRS AGENTVersionConvert=TRUE 进行版本升级需要注意以下几个问题:1. 版本升级时,需要与数据库连接进行参数校验,连接失败或已经无效的任务将不进行转换。 2. 版本升级后,所有在V1中设置的定时将无效。 3. 版本升级后,在V1中如果存在ORACLE的CLOB与TRS的PHRASE字段的

25、对应,将取消。 4. 版本升级后,在V2中显示的任务名为V1中创建的任务名后+_V1组成。 5. 升级后的任务没有任务的创建时间。 6. 如果V1的一个任务进行了一次版本转换后,在V1中修改了该任务的属性,再次转换,如果该任务在V2仍保持程序自动生成的文件名,该任务属性将自动修改。3.3 任务的导入TRS数据网关允许您将运行在不同机器上的任务导入或导出到其他机器上。点击“任务”菜单的“导入任务”将打开任务导入对话框。导入任务时,需要指定拟定导入的文件名以及拟定导入到任务组。在以下情况,您需要使用“编辑”功能打开拟定导入的文件,修改部分参数:1. 拟定导入的RDBMS任务来源于其他的机器,修改R

26、DBMS服务名。由于RDBMS任务组登录的本机RDBMS客户端创建的服务,如拟定导入文件的服务名在本机不存在,或者与本机的服务名所指的RDBMS数据库不同,将导致任务运行时登录RDBMS失败。在这种情况下,需要修改的服务名参数保存在SourceServer或TargetServer下(是源或目标取决于具体任务中RDBMS是作为源还是目标。)TaskName=任务名SourceServer=ora8iTargetServer=2. 拟定导入的RDBMS任务的本机创建的一个增量更新的任务,希望导入后转为完全更新任务。修改更新状态。更新状态的参数保存在UpdateMode中,0表示完全更新,1表示追

27、加更新,2表示增量更新。TaskName=任务名UpdateMode=0切记:A,不要将完全更新或追加更新的任务手工修改为增量更新,因为增量更新任务正常运行所需的Trigger是由创建任务时完成的,手工修改任务后将没有对应的Trigger,任务运行将导致失败。B,导入增量更新任务时一定要慎重,切实保证该增量更新任务所需的Trigger是有效的。 如果拟定导入的文件中包含的任务不属于指定的任务组,则导入任务失败。3.4 任务的导出TRS数据网关允许您将运行在不同机器上的任务导入或导出到其他机器上。点击“任务”菜单的“导入任务”将打开任务导出对话框。任务导出对话框包括以下内容: 当前任务组:显示进

28、行任务导出功能时的任务组信息。 目标文件名:由用户指定导出的文件名,文件后缀为.tsk。 任务范围: o 当前任务:如果进入任务导出功能时为在任务窗口指定任何任务,则该项灰显。 o 所有任务:指当前任务窗口中显示的所有任务。 o 指定范围:指当前任务窗口中显示的所有任务的子集,单个任务间一“,”分隔,多个任务间以“-”分隔,填写任务必须在任务说明的有效范围之内。 3.5 任务的视图TRS数据网关提供按任务类型查看任务的方法。在当前任务组,点击“查看”菜单的“查看”子项并选择不同的任务的方式,任务窗口将显示单前任务组指定任务类型的任务。针对RDBMS任务组,可查看的任务类型包括:所有任务 RDB

29、MS=TRS任务 TRS=RDBMS任务 TRS格式文件=RDBMS任务 RDBMS=RDBMS任务 针对TRS任务组,可以查看的任务类型包括:TRS格式文件=TRS任务 优化TRS数据库任务 3.6 创建任务3.6.1 创建“RDBMS=TRS”任务所谓“RDBMS=TRS”任务就是将保存在RDBMS(ORACLE,SYBASE,DB2,SQL SERVER,INFORMIX)数据库中的数据向TRS数据库进行迁移的任务。创建“RDBMS=TRS”任务可以单击“任务”菜单的“新建|RDBMS=TRS”菜单项,或单击工具条上的“创建任务”的“RDBMS=TRS”项。创建“RDBMS=TRS”任务

30、共有九步组成:第一步:登录RDBMS和TRS数据库;创建“RDBMS=TRS任务的第一步是登录RDBMS和TRS数据库。登录RDBMS数据库需要填写的参数包括:服务器地址:指安装RDBMS的服务器名,如果RDBMS是ORACLE的话,请填写本机CLIENT端设置的有效服务名。用户名:指登录RDBMS服务器的用户名。密码: 指登录RDBMS服务器的密码。是否保存密码:是:下次进入创建任务界面时自动显示上次使用的RDBMS服务器登录信息及其密码;否:下次进入创建任务界面时只显示上次使用的RDBMS服务器和用户信息,不显示密码。登录TRS数据库需要填写的参数包括:服务器地址:指安装TRS 服务器4.

31、0的IP地址。服务器端口:指TRS 服务器4.0的端口号,缺省为8888。用户名:指登录TRS服务器的用户名。密码: 指登录TRS服务器的密码。是否保存密码:是:下次进入创建任务界面时自动显示上次使用的TRS服务器登录信息及其密码;否:下次进入创建任务界面时只显示上次使用的TRS服务器和用户信息,不显示密码。如果在登录过程中出现异常,请在左下角的状态框中查看出错的原因。第二步:指定数据来源于RDBMS数据库表或视图;创建“RDBMS=TRS”任务的第二步是指定数据来源。源为RDBMS数据库时,数据来源可以是RDBMS的一个表或一个视图。 源为表需要选择源数据库及其表名。如果源数据库为ORACL

32、E,则无需指定源数据库名。 源为视图需要选择源数据库、视图,以及指定视图所在的主表。如果源数据库为ORACLE,则无需指定源数据库名。如果当前数据库中没有符合要求的视图,用户可以通过“新建视图”按钮创建新的视图。 第三步:指定RDBMS表或视图的主键;创建“RDBMS=TRS”任务的第三步是指定RDBMS表或视图的主键,该页面并不是在所有情况下均出现。 数据源为RDBMS表如果指定的数据源来自RDBMS表时,系统将自动检测该表在创建时是否设置了主键,如果设置了主键,则跳过该页面,否则需要指定主键。在系统提示的指定主键列表中列出了指定的源数据库表中所有可能成为主键的字段。可能成为主键的字段是指字

33、段类型为NUMBER, CHAR,DATE,VARCHAR2的字段。选定其中的一个字段后,系统将根据该字段在当前的数据库表中保存的所有数据是否唯一判断该字段是否可以做为主键。成功,则进入下一页。如果RDBMS数据库为ORACLE数据库,指定主键为ROWID时,不进行检测。如果建成多值处理的任务,主键可能不唯一,此时应该选中“多值处理”多选框再进入下一页。 建议:ORACLE数据库采用ROWID字段作为表的主键。 数据源为RDBMS视图如果指定的数据源来自RDBMS视图,则必须指定主键。在系统提示的指定主键列表中列出了指定的源数据库视图中所有可能成为主键的字段。可能成为主键的字段是指字段类型为N

34、UMBER, CHAR,DATE,VARCHAR2的字段。选定其中的一个字段后,系统将根据该字段在当前的数据库表中保存的所有数据是否唯一判断该字段是否可以做为主键。特别需要注意地是:由于一个视图必须有一个主表,而记录任务更新的TRIGGER是创建在主表的主键上的,在设置视图主键时必须保证指定的视图的主键必须同时是其主表的主键,且视图使用的主键名必须和主表使用的主键名一致。 如果指定的字段不能作为主键,请在左下角的状态框中查看出错的原因。 第四步:指定TRS目标数据库表以及数据迁移的更新类型、源RDBMS表的字符集;创建“RDBMS=TRS”任务的第四步是“设置目标数据库参数”。需要设置的参数包

35、含以下四个部分: 目标数据库名:目标数据库为TRS时,该项为空 目标表如果在当前显示的TRS目标列表中未包含您认为合适的TRS数据库,您可以单击新建表按钮,创建新的TRS数据库。 更新方式RDBMS=TRS支持的更新方式包括三种: o 完全更新:就是在每次执行任务时,先将指定的目标数据库表中的内容清空,然后再将所有源数据库表中符合条件的数据迁移到目标数据库中。 o 追加更新:就是在每次执行任务时,并不将目标数据库表中的内容清空,而是直接将所有源数据库表中符合条件的数据迁移到目标数据库中。 o 增量更新:就是自该任务创建成功时起,通过记录RDBMS源数据库表或视图记录的更新状态,在执行任务时,将

36、所有更新了的源数据库表中符合条件的数据迁移到目标数据库中。 TRS DOCUMENT字段保存RDBMS大对象数据的方式当目标TRS数据库在创建时选择了保存数据的情况下,将RDBMS的大对象数据库迁移到TRS DOCUMENT的对应字段时是存在两种可能的: o 将RDBMS大对象中的原格式文件(PDF/HTML)过滤为文本后保存到TRS DOCUMENT字段 o 将RDBMS大对象中的原格式文件(PDF/HTML)过滤为文本后保存到TRS DOCUMENT字段,同时将原格式文件也保存到TRS DOCUMENT字段。 RDBMS源数据库表的语言我们将RDBMS字符集的转换分为两部分: o 全表统一

37、字符集:是指用户保存在RDBMS指定表中的所有记录均采用相同的字符集。对ORACLE来说,安装本系统的机器上必须采用简体中文。 o 由字段指定字符集:是指用户指定一个字符型(CHAR或者VARCHAR)字段,在该字段中说明保存在RDBMS指定表中的每一条记录的字符集。对于每一种RDBMS支持的字符集以及正确的说明文字,请查看“字符集转换”。 第五步:字段匹配;创建“RDBMS=TRS”任务的第五步是“字段匹配”。字段匹配页面由三部分组成: 字段列表o RDBMS源数据库表字段源数据库字段显示的是指定的RDBMS源数据库表/视图的所有字段以及它们的类型、长度、主键和其他属性。当字段类型不为字符型

38、(CHAR/VARCHAR)时,所有的长度均为0。如果以上字段中包含了字符型(CHAR/VARCHAR)字段,则用户还可以设置“URL”列信息;如果以上字段中包含了大对象字段,则用户还可以设置大对象的属性和类型。o TRS目标数据库字段目标数据库字段显示的是指定的TRS目标数据库的所有字段以及它们的类型和长度。当字段类型不为字符型(CHAR)时,所有的长度均为0。 o 右键菜单点击位于源数据字段列表左上方或位于目标数据库字段列表右上方的图标,将分别打开一个右键菜单,其中源数据库字段列表的右键菜单的形式为:;目标数据库字段列表的右键菜单为:位于源/目标数据库表字段列表上方的右键菜单说明的是源/目

39、标数据库字段列表支持显示的基本列信息,除“字段名”外,其他列可以通过取消选中该列而隐含该列的显示。 URL的设置点击简单的字符型字段的URL列,该列将自动显示一个字母U,说明已将该字段说明为URL,再次点击将取消U,即取消设置。需要特别说明的是,字符型字段在未指定保存URL之前是不允许和TRS的BIT类型字段进行匹配的。如果用户需要将该字段中保存的URL(例如:http:/192.9.200.21/pic/1.gif)作为文件保存到BIT字段,请先将该字段指定为URL。注意:如果某一个字符型字段已经被设置为主键,则该字段禁止设置为URL。大对象的设置大对象的处理可以分为三种情况,其中缺省时为“

40、不处理”。o 不做处理所谓“不做处理”,就是如果用户在创建TRS数据库时选择保存数据,则将原格式文件直接保存到TRS数据库中;如果用户在创建TRS数据库中选择为只保存索引,则该字段内容不装入TRS数据库。如果当前的大对象类型为ORACLE的LONG/CLOB/NCLOB,SQL SERVER 的text/ntext则不做处理即作为txt处理;其他大对象类型时,如果用户指定的文件格式在TRS支持识别的48种格式之外,请选择“bit”作为您指定的文件格式。 o 类型唯一所谓“类型唯一”,是指在大对象字段中保存的数据格式为.txt, .htm/.html,.pdf(只支持 PDF 3.0),.doc

41、, .rtf, .xls, .ppt格式之一时,系统将自动提取原格式文件的文本作为索引保存到TRS数据库的指定字段中。如果用户在创建TRS数据库时选择保存数据同时创建任务时选择保存原格式文件,则将原格式文件同时保存到TRS数据库。如果用户将非以上格式的数据说明为以上格式之一,数据迁移时按记录进行分析,分析失败后该条记录指定字段在TRS数据库对应字段中保存的内容为空。 o 由字段说明所谓“由字段说明”,就是指当用户在一个大对象字段中保存多种格式的大对象数据(可以是多种文本格式,也可以是多种二进制文件格式,也可以同时保存多种文本格式和多种二进制文件格式)时,用户需要在RDBMS数据库表/视图中,指

42、定一个用于说明每条记录保存数据格式的字段,该字段的类型可以为CHAR或VARCHAR。保存在该字段中的内容应说明大对象数据的“文件后缀名”。例如:某条记录的大对象字段保存的是“test.html”文件,则说明字段为“html”。需要特别说明的是:以“*.html”或“.html”的形式来描述均为不正确的描述方式。说明文字的大小无关,如果说明的内容不正确,则该记录的格式将作为“txt”处理。需要说明的是:如果该RDBMS大对象字段匹配的TRS目标字段为BIT类型,则无论采用何种设置,在BIT类型字段中均保存文件的原格式,而非过滤后文本。 字段的匹配源数据字段与目标数据字段的匹配是通过鼠标的拖放进

43、行的。您可以选中源数据列表的一行,按住鼠标左键,然后拖放到目标数据库列表中。如果选中的源数据列表的指定字段的类型能够和目标数据库列表的鼠标所在行的字段类型进行匹配,则光标将显示为,否则为。如果您希望该源指定字段和某一支持匹配的目标字段进行匹配,松开鼠标左键即可。当源字段类型和目标字段类型可以进行匹配,但源字段的长度小于目标字段的长度时时进行匹配时,系统将提示您选择“是”,将完成匹配,“否”,将不做任何操作。 功能按钮: o 按目标匹配:所谓“按目标匹配”就是系统自动根据源数据字段名和目标数据字段名进行匹配,也即使说如果某一源字段名与某一目标字段名相同且上述两个字段的类型与长度均符合匹配条件,则

44、自动匹配。o 删除匹配:在源或目标字段中选中一行已经进行匹配的字段,点击“删除匹配”将删除指定字段以及它的对应字段的匹配信息。 o 还原:取消所有已经设置的字段匹配信息,并将源字段信息恢复到初始状态。 报告出错信息的对话框:点击“下一页”时,如果判断当前的匹配信息不正确,报告出错原因。第六步:指定FTP参数;创建“RDBMS=TRS”任务的第六步是“设置FTP参数”,该页面只有在“字段匹配”页面用户指定了某一字符型字段中保存的是URL时方出现。如果用户在指定的字段中保存的数据均为HTTP格式的URL,则无需填写任何参数,可以直接进入下一页。如果用户在指定的字段中包含了至少一个FTP格式的URL

45、,则需要填写相应的FTP用户名和密码。请注意密码为大小写敏感。当用户名和密码均为空时,系统自动设置为匿名登录第七步:给出RDBMS表或视图的检索条件;创建“RDBMS=TRS”任务的第七步是给出检索条件。对RDBMS源数据库表或视图中选取数据时,本系统支持对记录的“行选”,也就是说,用户可以指定一定的检索条件,符合上述条件的记录的对应字段方作为有效数据迁移到TRS数据库中。“给出检索条件”的页面由三部分组成: 检索条件检索条件对话框为一文本框。用户可以在该框内填写或编辑输入的检索条件。检索条件可以为空,为空时意味着选择所有的记录。输入的检索条件应符合SQL语句中WHERE子句的语法。 可选字段可选字段为一列表框,显示了用户选定的RDBMS源表或视图中所有的字段信息,双击某一字段,该字段将自动出现在检索条件框内。 基本运算符基本运算符为按钮,单击任何一个按钮

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号