文本信息的加工.ppt

上传人:牧羊曲112 文档编号:5986589 上传时间:2023-09-11 格式:PPT 页数:36 大小:2.65MB
返回 下载 相关 举报
文本信息的加工.ppt_第1页
第1页 / 共36页
文本信息的加工.ppt_第2页
第2页 / 共36页
文本信息的加工.ppt_第3页
第3页 / 共36页
文本信息的加工.ppt_第4页
第4页 / 共36页
文本信息的加工.ppt_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《文本信息的加工.ppt》由会员分享,可在线阅读,更多相关《文本信息的加工.ppt(36页珍藏版)》请在三一办公上搜索。

1、4.1文本信息加工,克州三中 2011年9月,复习:,模式识别机器翻译智能机器人计算机博弈智能代理专家系统、机器证明、数据挖掘,利用人工智能技术加工信息,欣赏,4.1.1 文字及其处理技术,文字是人类为了更加流畅地表述意义,传递经验发明的工具,人们利用文字记载自然变化、历史沿革、生产经验、建设成果等各种信息,极大促进人类文明的发展进程。,思考:汉字是怎么造出来的?,汉字的造字法有四种:象形、指事、会意、形声。,从字体上看,就是本字倒过来。上部为树头,下部为树梢,在树梢上加一小横,就表示这里是树梢。因此,末的最初的意义是树梢。(上、下、刃等),象形,指事,象形文,汉字的造字法,金文明为日月幷照之

2、会意字。(信=人+言),会意,形声,字的一部分是“形旁”表示字义,一部分是“声旁”表示读音,如:“清”是“水”形“青”声,“河”是“水”形“可”声。,猜一猜:以下象形字分别是什么?,(休),(采),(焚),(甘),(刃),东巴文字,东巴文是一种原始的图画象形文字,主要为东巴教徒传授使用,书写东巴经文,故称东巴文。纳西话叫“思究鲁究”,意为“木迹石迹”,见木画木,见石画石。,东巴文字是唯一活着的象形文字。,云南 纳西族 东巴文字,猜猜看,上面的象形文字究竟表示什么意思?,靠,睡,登,越,喝,牙齿,看书,去,东巴象形文字是目前世界上仅存的为数不多的古象形文字之一,并且是世界上唯一仍在使用的古象形文

3、字,是文字史上的活化。东巴象形文字在工艺美术设计具有很高的审美价值。,实践:电子东巴(5分钟),安装 电子东巴5.0 版本拼音输入法 提示:网上查找 电子东巴5.0下载安装该输入法输入以下东巴文字 我 喝茶 吃饭 爱 树 母亲中午晚上颜色红色 字号初号提示:输入法中选择“电子东巴”输入法。,思考:中国汉字的发展过程是怎么样的?,文字之旅:第1站甲骨文,金文,文字之旅:第2站金文,小篆,大篆,文字之旅:第3、4站大篆、小篆,隶书(张迁碑),草书(张旭),行书(王羲之),文字之旅:第N站隶书、草书、行书,3 书法是一种凝结了我国民族文化精髓的特殊的艺术形式,兰亭集序(局部)晋王羲之,徐冰方块英文,

4、将26个字母改造成类似中国汉字的偏旁部首,Art For The People,Ti yan qing jing:pin yin yu han zi 体验情境:拼音与汉字,村居(清)高 鼎 草长莺飞二月天,拂堤杨柳醉春烟。儿童散学归来早,忙趁东风放纸鸢。,历史上使用的文字处理技术,手写,刻字,雕版印刷,活字印刷,机械式打字机,计算机文字处理,计算机文字处理,只能处理英文,可处理包括象形文字在内的任何文字,如何在计算机中处理汉字?,汉字的编码,目前计算机上使用的汉字编码主要有三种:,输入码(外码),机内码(内码),输出码(字型码),用于输入汉字的编码,用于存储汉字的编码,用于输出汉字的编码,区位

5、码:4860全拼编码:xiong五笔字型:CEXO,熊,用机内码表示、存储,如国标码(GB)和BIG5码,用汉字字型输出汉字,体验文字处理技术,汉字的编码,文字及其处理技术,输出码(字型码)汉字的输出,机内码(内码)汉字的存储,输入码(外码)汉字的输入,书法是一门凝结了我国民族文化精髓的艺术,汉字的创造饱含民族的智慧,文字的发明是为了更流畅地表述意义、传递经验,中文信息处理技术发展历史,课堂小结,(教学重点),(教学难点),1、体验东巴文字的计算机处理技术2、学会使用多种汉字编码输入汉字3、根据信息需求,选择合适的字处理软件进行处理,上机实践,输入码(外码):用于输入汉字,如区位码、拼音码、王

6、码(五笔字型)、自然码等。机内码(内码):供计算机系统内部进行存储、加工处理、传输而统一使用的代码,用于储存汉字,如国标码(GB)、BIG5码等。,输出码(字型码):存储在计算机内的汉字在屏幕上显示或打印机打印出来时,必须以汉字字型输出,汉字的输出码实际上是汉字的字型码,它是由汉字的字模信息所组成的。汉字是一种象形文字,每个汉字都是一个特定图形,这种图形可以用点阵、向量等方式表示。,字模(点阵、向量)如8*8点阵,Bit(位)Byte(字节)B1B=8bit1KB=1024B1MB=1024KB1GB=1024MB1TB=1024GB,如32*32点阵就需要:32*32位=32*32/8B=1

7、28B,用8*8点阵表示一个“中”字,这个汉字占8行,每一行8个点,其中每一个点用一个二进制位表示,值“0”表示没有笔形,值“1”表示有笔形,储存这个字型码需要88=64位二进制,即8个字节(1字节=8位二进制)。,计算机汉字的处理过程,例:“春”字在计算机中的处理过程,1.从键盘用拼音输入法输入外码“chun”;2.从外码表中找出与之对应的汉字机内码;3.按照“机内码”找到存放字型码的地址;4.取出“字型码”在屏幕上显示出来。,任务一:安装“东巴文字”输入法,打出“中午”、“晚上”的东巴字。,任务二:请大家一会自己动手,做出右图中差不多的效果。其中的背景图片可在“D:/素材”里,选择喜欢的图片。其他内容与效果要相同。,End,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号