《扫描仪常识与OCR全解.ppt》由会员分享,可在线阅读,更多相关《扫描仪常识与OCR全解.ppt(47页珍藏版)》请在三一办公上搜索。
1、扫描仪常识,什 么 是 扫 描 仪,扫描仪(Scanner)是一种高精度的光电一体化的高科技产品,它是将各种形式的图像信息输入计算机的重要工具。是继键盘和鼠标之后的第三代计算机输入设备。它是功能极强的一种输入设备。人们通常将扫描仪用于计算机图像的输入,而图像这种信息形式是一种信息量最大的形式。从最直接的图片、照片、胶片到各类图纸图形以及各类文稿资为都可以用扫描仪输入到计算机中进而实现对这些图像形式的信息的处理、管理、使用、存贮、输出等。,扫描仪有哪些用途,1.可在文档中组织美术品和图片;2.将印刷好的文本扫描输入到文字处理软件中,免去重新打字之麻烦;3.对印制版、面板标牌样品(该板即使无磁盘文
2、件,又无菲林软片)扫描录入到计算机中,可对该板进行布线图的设计和复制,解决了抄板问题,提高抄板效率。4.可实现印制板草图的自动录入、编辑、实现汉字面板和复杂图标的自动录入。5.在多媒体产品中添加图像。6.在文献中集成视觉信息使之更有效地交换和通讯。,扫描仪的分类,扫描仪的种类繁多,根据扫描仪扫描介质和用途的不同,目前市面上的扫描仪大体上分为:平板式扫描仪、名片扫描仪、胶片扫描仪、馈纸式扫描仪、文件扫描仪、除此之外还有手持式扫描仪、鼓式扫描仪、笔式扫描仪、实物扫描仪和3D扫描仪。,平板式扫描仪,平板式扫描仪又称为平台式扫描仪、台式扫描仪,这种扫描仪诞生于1984年,是目前办公用扫描仪的主流产品。
3、从指标上看,这类扫描仪光学分辨率在3008000dpi之间,色彩位数从24位到48位。部分产品可安装透明胶片扫描适配器,用于扫描透明胶片,少数产品可安装自动进纸实现高速扫描。扫描幅面一般为A4或是A3。从原理上看,这类扫描仪分为CCD技术和CIS技术两种,从性能上讲CCD技术是优于CIS技术的,但由于CIS技术具有价格低廉,体积小巧等优点,因此也在一定程度上获得了广泛的应用。,名片扫描仪,名片扫描仪顾名思义能够扫描名片的扫描仪,以其小巧的体积和强大的识别管理功能,成为许多人办公人士最能干的商务小助手。名片扫描仪是由一台高速扫描仪加上一个质量稍高一点的OCR(光学字符识别系统),再配上一个名片管
4、理软件组成。目前市场上主流的名片扫描仪的主要功能大致上以高速输入,准确的识别率,快速查找,数据共享,原版再现,在线发送,能够导入PDA等为基本标准。尤其是通过计算机可以与掌上电脑或手机连接使用这一功能越来越为使用者所看重。此外名片扫描仪的操作简便性和携带便携性也是选购者比较的两个方面。,胶片扫描仪,胶片扫描仪又称底片扫描仪或接触式扫描仪,其扫描效果是平板扫描仪+透扫不能比拟的,主要任务就是扫描各种透明胶片,扫描幅机从135底片到4*6英寸甚至更大,光学分辨率最低也在1000dpi以上,一般可以达到2700dpi水平,更高精度的产品则属于专业级产品。,滚筒式式扫描仪,滚筒式扫描仪又称为馈纸式扫描
5、仪或是小滚筒式扫描仪,滚筒式扫描仪诞生于90后代初,由于平板式扫描仪价格昂贵,手持式扫描仪扫描宽度小,为满足A4幅面文件扫描的需要,推出了这种产品,这种产品绝大多数采用CIS技术,光学分辨率为300dpi,有彩色和灰度两种,彩色型号一般为24位彩色,也有及少数滚筒式扫描仪采用CCD技术,扫描效果明显优于CIS技术的产品。但由于结构限制,体积一般明显大于CIS技术的产品。随着平板扫描仪价格的下降,这类产品也于96-97年前后退出了历史的舞台。不过2001年左右又出现了一种新型产品,这类产品与老产品的最大区别是体积很小,并采用内置电池供电,甚至有的不需要外接电源,直接依靠计算机内部电源供电,主要目
6、的是与笔记本电脑配套,又称为笔记本式扫描仪。,文件扫描仪,文件扫描仪具有高速度、高质量、多功能等优点,可广泛用于各类型工作站及计算机平台。并能与二百多种图像处理软件兼容。对于文件扫描仪来说一般会配有自动进纸器(ADF),可以处理多页文件扫描。由于自动进纸器价格昂贵,所以文件扫描仪目前只被许多专业用户所使用。,手持式扫描仪,手持式扫描仪诞生于1987年,是当年使用比较广泛的扫描仪品种,最大扫描宽度为105mm,用手推动,完成扫描工作,也有个别产品采用电动方式在纸面上移动,称为自动式扫描仪。手持式扫描仪绝大多数采用CIS技术,光学分辨率为200dpi,有黑白、灰度、彩色多种类型,其中彩色类的一般为
7、18位彩色,也有个别高档产品采用CCD用为感光器件,可以实现24位真彩色,扫描效果较好。这类扫描仪广泛使用的时候,平板式扫描仪价格还非常昂贵,而手持式扫描仪由于价格低廉,获得了广泛的应用,后来,随着扫描仪价格的整体下降,手持式扫描仪扫描幅面而太窄,扫描效果差的缺点越来越暴露出来,1995-1996年,各扫描仪厂家相继停产了这一产品,从而使手持式扫描仪退出了历史的舞台。,鼓式扫描仪,鼓式扫描仪又称为滚筒式扫描仪,当然这种滚筒扫描仪与上面所说的滚筒式扫描仪不是一回事。鼓式扫描仪是专业印刷排版领域应用最为广泛的产品,他使用的感光器件是光电倍增管,是一种电子管,性能远远高于CCD类扫描仪,这些扫描仪一
8、般光学分辨率在1000-8000dpi,色彩位数24位-48位,尽管指标与平板式扫描仪相近,但实际上效果不同的,当然价格也高得惊人,低档的也在10万元以上,高档的可达数百万元。由于该类扫描仪一次只能扫描一个点,所以扫描仪速度较慢,扫描一幅图花费几十分钟甚至几个小时是很正常的事情。,笔式扫描仪,笔式扫描仪又称为扫描笔,是2000年左右出现的产品,市场上很少见到。该扫描仪外型与一支笔相似,扫描宽度大约只有四号汉字相同,使用时,贴在纸上一行一行的扫描,主要用于文字识别,具体将来能够获得如何的发展目前还不清楚。,实物扫描仪,真正的实物扫描仪并不是我们市场上见到的有实物扫描能力的平板扫描仪,其结构原理类
9、似于数码相机,不过是固定式结构,拥有支架和扫描平台,分辨率远远高于市场上常见的数码相机,但一般只能拍摄静态物体,扫描一幅图像所花费的时间与扫描仪相当。,3D扫描仪,真正的3D扫描仪也不是我们市场上见到的有实物扫描能力的平板扫描仪,其结构原理也与传统的扫描仪完全不同,其生成的文件并不是我们常见的图像文件,而是能够精确描述物体三维结构的一系列坐标数据,输入3DMAX中即可完整的还原出物体的3D模型,由于只记录物体的外型,因此无彩色和黑白之分。从结构来讲,这类扫描仪分为机械和激光两种,机械式是依靠一个机械臂触摸物体的表面,以获得物体的三维数据,而激光式代替机械臂完成这一工作。三维数据比常见图像的二维
10、数据庞大得多,因此扫描速度较慢,视物体大小和精度高低,扫描时间从几十分钟到几十个小时不等。,扫描仪相关术语,光学分辨率,在了解光学分辨率之前应首先明确扫描仪的分辨率分为光学分辨率和最大分辨率,由于最大分辨率相当于插值分辨率,并不代表扫描仪的真实分辨率,所以我们在选购扫描仪时应以光学分辨率为准。光学分辨率是指扫描仪物理器件所具有的真实分辨率。而且,扫描仪的光学分辨率是用两个数字相乘,如600*1200dpi,其中前一个数字代表扫描仪的横向分辨率,例如一个具有5000个感光单元的CCD器件,用于A4幅面扫描仪,由于A4幅面的纸张宽度是8.3英寸,所以,该扫描仪的光学分辨率就是5000/8.3=60
11、0dpi,换句话说,该扫描仪的光学分辨率是600dpi。后面一数字则代表扫描仪的纵向分辨率或是机械分辨率,是扫描仪所用步进电机的分辨率,扫描仪的步进电机的精度与扫描仪的横向分辨率相同,但由于各种机械因素的影响,扫描仪的实际精度(步进电机的精度)将远远达不到横向分辨率的水平,一般来说。扫描仪的纵向分辨率是横向分辨率的两倍,有时甚至是四倍。如:600*1200dpi。但有一点要注意:有的厂家为了显示自已的扫描仪精度高,将600*1200dpi写成1200*600dpi,因此在判断扫描仪光学分辨率时,应以最小的一个为准。,扫描速度,扫描速度是扫描仪的一个重要指标,一般所谓的扫描速度是指扫描仪从预览开
12、始到图像扫描完成后,光头移动的时间。但这段时间并不足以准确地衡量扫描的速度,有的时候,把扫描图像送到word文档中所花费的时间,往往比单纯的扫描过程还要长。而作业任务从打开扫描仪完成预热,到把从原稿放置在扫描平台上开始,到最终完成图像处理的整个过程都计算在内,更全面地体现了扫描仪的速度性能。扫描速度可分为预扫速度和扫描速度。对于这两个速度,我们应该倾向于注重预扫速度而不是实际的扫描速度。这是因为,扫描仪受接口(目前绝大多数扫描仪为USB接口)带宽的影响,通常速度差别并不是很大。而扫描仪在开始扫描稿件时必须通过预扫的步骤确定稿件在扫描平台上的位置,因此预扫速度反而是很影响实际扫描效率的。因此在选
13、择扫描仪时,应尽量选择预扫速度快的产品。扫描仪扫描的速度与系统配置、扫描分辨率设置、扫描尺寸、放大倍率等有密切关系。一般情况下,扫描黑白、灰度图像,扫描速度为2100ms/线;扫描彩色图像,扫描速度为5200ms/线。一般情况下,人们总是希望扫描仪速度快,但是扫描仪的工作方式是通过扫描仪的光源,利用一种色彩分离方法和CCD(电荷耦合器件)或PMT(光电倍增管)来采集被扫描对象的光信息,并将该光信息传输到一个计算机图像文件中去。扫描仪速度快当然好,但不能影响图像质量。因此,不是扫描仪的扫描速度越快越好,扫描速度非常高的扫描仪,在扫描过程中,可能会丢失一些图像信息。有些扫描仪在低分辨率时扫描速度快
14、,但在高分辨率时扫描速度不一定快。因此必须在保证质量的前提下,提高扫描仪的速度。,扫描速度的表示方式,扫描速度的表示方式一般有两种:一种用扫描标准A4幅面所用的时间来表示,另一种使用扫描仪完成一行扫描的时间来表示。,扫描的过程,扫描的过程一般是这样的,当透镜把光线投射在CCD元件上后,CCD就输出模拟信号,然后经过A/D转换形成RGB三路独立的数字信号,并把这三种信号转换成Twain接口标准。要注意的是,最后转换时需要一个很长计算过程,该过程是制约扫描速度的瓶颈,对该步骤采取不同的处理方法会产生不同的扫描速度。,最大分辨率,最大分辨率又称为插值分辨率或软件分辨率,是通过数学算法增大图像分辨率的
15、方法,但我们在实际购买中要以光学分辨率为准,在光学分辨率相同的条件下,最大分辨率只能作为参考。目前最大分辨率的算法大致分为三种补点法:就是说如果两个像素之间需要加一个点,就用第一个像素的数据作为这个点的值,这个算法的优点是运算量小,速度快,但效果差,容易造成马赛克现像。,平均值法:就是说如果两个像素之间需要加一个点,就是用这两个点的平均值作为这个点的值,这种算法的效果比补点法要好得多。二次乘方法:这个算法是各种算法中效果最好的算法,也是运算最复杂的算法,为了得到两个像素之间新增的点的数值,需要取该像素前后左右各两个点的数值,模拟出这四个点数据变化的规律的曲线,从而获得这个点的数值。目前限于技术
16、水平和扫描速度限制,多数扫描仪在横向插值时采用平均算法,纵向插值时采用补点法,只有少数扫描仪在横向和纵向都采用平均值法。与之相比,目前的图像处理软件普遍采用二次乘方作为插值算法,因此生成的图像效果明显好于扫描仪自身插值的效果。无论从效果角度还是速度角度讲,扫描时,都不要使用超过扫描仪光学分辨率的精度进行扫描,如确实需要提高扫描精度,可以使用软件进行放大,以获得更好的图像效果,预扫时间,预扫时间其实就是扫描仪对所有的扫描面积进行一次快速扫描所需的时间。扫描仪从打开到进行正式扫描,有一段光源预热时间,如果是进行长时间连续扫描作业,这段预热时间似乎可以接受或者忽略不记。但是如果并不是连续作业,那么在
17、每次扫描之前都要进行光源预热,不仅浪费了大量时间,而且对扫描仪的使用寿命也是一个极大的挑战。冷阴极荧光灯冷阴极荧光灯具有体积小、亮度高、寿命长的特点,但工作前需要预热。该类光源已经广泛应用于平板式扫描仪中。,色彩位数,色彩深度又称色彩位数,是指扫描仪对图像进行采样的数据位数,也就是扫描仪所能辨析的色彩范围。目前有18位、24位、30位、36位、42位和48位等多种。应该说,色彩位数越高,扫描仪越具有提高扫描效果还原度的潜力。但是否色彩位数越高,扫描效果越好呢?不是这样的。首先要考虑色彩位数的来源,扫描仪的色彩位数和色彩还原效果取决于如下的几个方面:感光器件的质量,数模转换器的位数,色彩校正技术
18、的优劣,扫描仪的色彩输出位数。,扫描元件,扫描仪的核心部分是完成光电转换的部件扫描元件(也称为感光器件)。目前市场上扫描仪所使用的感光器件有四种:电荷藕合元件CCD(硅氧化物隔离CCD和半导体隔体CCD)、接触式感光器件CIS、光电倍增管PMT和互补金属氧化物导体CMOS。,四种扫描元件中,光电倍增管的成产成本最高,少则几十万元,而且扫描速度很慢,一张图往往需要几十分钟的时间,所以光电倍增管只用在最专业的鼓式扫描仪上。而CCD和CIS的生产成本相对较低,扫描速度相对较快,扫描效果能满足大部分工作的需要,所以CCD或CIS的扫描仪已成为许多家用、办公和SOHU一族的选择。作为生产成本最低的CMO
19、S器件,由于其扫描成像质量的限制,容易出现杂点,所以目前只使用在名片扫描仪上。,电荷藕合元件CCD相关术语:,CCD英文全称:Charge Coupled Device。这两种感光器件与我们日常使用的半导体集成电路相似,在一片硅晶片集成了几千到几万个光电三极管,这些光电三极管分为三列,分别用红绿蓝色的滤色镜罩住,从而实现彩色扫描。光电三极管在受到光线照射时可以产生电流,经放大后输出。该类感光器件近年性能提高很大,其高端产品的性能已经接近低档的光电倍增管,但由于数千个光电三极管的距离很近(微米级),并且各三极管之间的绝缘是依靠半导体PN结来的绝缘。隔离电阻较小,因此,在各光电三极管之间存在着明显
20、的漏电现像,使各感光单元的信号产生相互干扰,降低了扫描仪的实际清晰度。为了改善这一情况,现在可以采用硅氧化物隔离技术,也就是说,在器件加工过程中,将各个光电三极管之间的半导体单晶硅用SiO2(二氧化硅)替代,由于SiO2是非常好的绝缘材料,几乎杜绝了光电三极管之间的漏电现像,因而在两台扫描仪性能指标相同的情况下,使用硅氧化物隔离CCD的扫描仪的实际清晰度将有一个质的飞跃。不过,这种技术产品的生产成本要比半导体隔离技术产品的生产成本高出几倍,因此,目前只能用在5000元以上的专业级扫描仪之中。而目前市场上的几乎所有家用和办公用扫描仪,都是采用半导体隔离的CCD,性能不可能不受到影响。,接触式感光
21、器件cis相关术语:,接触式感光器件CIS(Contact Image Sensor)与CCD技术几乎是同时出现的,它使用的感光材料一般是我们用来制造光敏电阻的硫化镉,它很容易制成一条长的阵列,而且生产成本只有半导体隔离CCD的1/3,当时主要是用在低档黑白手持式扫描仪和传真机上,由于尺寸太大,无法使用镜头成像,只能依靠贴近目标来识别目标,因此光学分辨率最高只能达到200dpi,到1994年前后,随着扫描仪彩色化、高精度化,接触式感光器件本身噪声大,动态范围小,精度低的缺陷暴露无疑,迅速从扫描仪市场上销声匿迹了。在其后的四年中,我们只能在传真机上看到它的身影。,光源,光源指的是扫描仪机身内部的
22、灯管,与步进电机自成一体,随步进电机一起运动。对扫描仪而言,光源是非常重要的,因为CCD上所感受的光线,全部来自于扫描仪自身的灯管。光源不纯或偏色,会直接影响到扫描结果。在正午的时候,我们用肉眼去看一张白纸,看到的是白色,但黄昏的时候,在金黄色阳光的作用下,同样的一张白纸会呈现出金黄色。光源变了,我们看到的结果自然不同。专业扫描仪或一些高端家用或商用扫描仪,在扫描前会自动检测灯管发出的光线强度,特别是在扫描仪刚启动时,由于灯管未进入稳定状态,扫描仪有一定的预热时间,只有当光线强度足够达到标准,机内的光源检测传感器才会发出通过指令。而这时的扫描仪才能以最佳的工作状态进行扫描。普通家用、办公用扫描
23、仪基本没有自检程序,有的扫描仪灯管发出的光线甚至连肉眼看上去都感觉不到刺眼,这样的光线强度自然不足以表现原稿中的暗部细节。,光源类型,现在扫描仪内部用得较多的光源类型主要有三种:冷阴极荧光灯、RGB三色发光二极管(即LED),而少部分扫描仪采用了卤素灯光源。在我们平时选购扫描仪时,除了几个重要的参数外,光源平均失效时间也值得关注一下。因为多数扫描仪销售商都不会提供这个参数。但是,我们应该寻问光源失效时间这个参数,因为如果光源失效时间很低,那么有可能我们总是需要很多开销来更换光源,这样很不合适。所以,在购买时,注意这个细节。,冷阴极荧光灯,冷阴极荧光灯具有体积小、亮度高、寿命长的特点,但工作前需
24、要预热。该类光源已经广泛应用于平板式扫描仪中,卤素灯光源,卤素灯多应用于一些高端平板式扫描仪如某些胶片扫描仪中,亮度非常高,预热时间短,而且维护、更换容易,但它的发热量也比较高,使用一定时间后即可能出现衰减。,发光二极管,发光二极管功耗小,噪音低,发热量小,且无需预热,但亮度低,亮度均匀性略差,寿命一般也比较短(一些CIS型扫描仪采用了此类光源)。,扫 描 仪 的 品 牌,佳能爱普生 中晶明基惠普 清华紫光汉王方正虹光柯达精益 富士通,常用图像格式:,1.JPG(JPEG)Joint Photographic Expert Group 联合图像专家组 2.TIF(TIFF)Tagged Ima
25、ge File Format 标记图像文件格式3.GIF Graphics Interchange Format 可交换的图像文件4.BMP Bit Map 位图格式5.PDF格式是一种跨平台的文件格式,什 么是OCR,OCR是英文Optical Character Recognition 的缩写,中文译为“光学字符识别”,意思是通过光学技术对文字进行识别。就是通过扫描仪、数码相机等设备把文件资料的图像输入电脑,然后用OCR软件把图像里面的文字、表格、插图、符号等识别出来转换为计算机文档,汉王 清华文通蒙恬丹青尚书紫光,OCR 品牌,OCR的普及应用:一 文本王文字、表格、图像高速录入系统,文
26、本王是什么?,汉王文本王是一套软硬件结合的文字识别系统 他不是扫描仪汉王文本王是专门录入文字、表格、图形、公章、符号、批注、图形的扫描识别还原系统,只需按一个键资料即可直接进Word,保持原版布局,并可任意校对、修改、编辑、查询、索引和打印。汉王文本王是采用汉王科技顶尖的OCR(光学识别)核心和超强RTF(精确版面还原)算法,结合特定的文本扫描技术,利用汉王科技独创一键OK引擎,将纸张资料和电子图片电子化为Word文档,以便进行数据的快速再加工和处理,文本王的主要软件参数,识别率:(印刷体混排文稿)99.5%以上识别速度:6000字/分字体:可识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一
27、百多种字体,并支持多种字体混排。字号:初号至小六号 字库:简体字符集:国标GB2312-80的全部 一、二级汉字6800多个;纯英文字符集;简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字,文本王识别步骤,可分为 图像获取图像处理版面分析识别输出等五大步骤,文本王的特点,1 一键扫入,WORD输出:用户操作简单快捷,与WORD无缝连接,只需轻松按下一键,文档自动输出到WORD。2 多种模式,任君选择:用户可根据工作需要或个人习惯选择自动、单步智能工作模式或专业批量工作模式。3 复杂版面,自动分析:智能分析各种中、英、繁、表、图及混排格式的文本,无需过多的人工干预。4 顶
28、尖核心,识别准确:采用最先进的脱机字符识别核心,印刷体混排文稿的识别率在99.5以上,纯英文文稿的识别率在99.9以上。,5 表格输入,轻松实现:多样化的表格判、识,完美精确的表格还原,瞬间即可转化成为可任意编辑的电子表格。,批量输入,快速高效:大批量的文件扫描,强化的全自动化文字识别,速度快,效率更高。版面还原,原文重现:精确保留了原版面格式,准确恢复文本原貌。多种格式,自由保存:识别完的文档可以保存为多种格式(PDF、HTML、RTF、XLS、TXT)的文件,方便实用。文本朗读、翻译,省时省力:汉王阅读小精灵,避免眼睛疲劳,让您随心所欲听;翻译软件助您跨越语言障碍。A 3 表格,A 4 拼
29、接:A3表格可以通过A4扫描仪两次扫描,通过软件实现拼接。,11.图文索引,方便快捷:快速导出全文索引,助您轻松实现全文检索,帮您图片管理更上一层楼。12.摘抄高手,随心所欲:对扫描图像文字内容随时摘抄,即时编辑,任意发送到文字操作窗口13.公章处理:自动提取公文中红色文头、红色公章,红头红章以下的文字可以进行编辑。14.手写文稿识别:脱机手写识别技术是世界范围内的技术难题,汉王已走在业界前列,能够识别工整手写体。建议用户工整书写,适当扩大字间距和行间距,以提高识别率。15.表格外文字拼接:该版本在对表格进行拼接时可以连同表格外的文字一起完成拼接。16.邮件直发:录入结果可直接进入邮件进行发送。,