《第3讲五笔输入法.ppt》由会员分享,可在线阅读,更多相关《第3讲五笔输入法.ppt(24页珍藏版)》请在三一办公上搜索。
1、1.键名字的输入,各个键上的第一个字根,即“助记词”中打头的那个字根,我们称之为“键名”。键名中的绝大多数本身就是一个汉字,其输入方法是:把所在的键连击4下,例如。王:王王王王 11 11 11 11(G G G G)又:又又又又 54 54 54 54(C C C C)月:月月月月 33 33 33 33(E E E E),因此,把每一个键都连打4下,即可输入25个键名汉字,2.成字字根的输入,在五笔字型字根键盘的每个键位上,除键名以外自身也是汉字的字根称为“成字字根”。除键名外,成字字根一共有102个(其中包括相当于汉字的“氵、亻、勹、凵、刂”等)。键名代码首笔代码次笔代码末笔代码,表列出
2、了各区中的成字字根。,如下例所示:,3.单笔划汉字的输入,5种单笔“一、丨、丿、乙”在国家标准中都是作为汉字来对待的。丨:21 21 24 24(H H L L)丿:31 31 24 24(T T L L)丶:41 41 24 24(Y Y L L)乙:51 51 24 24(N N L L),4.普通汉字的输入,为了帮助记忆和便于学习,五笔字型输入法的编码规则被编成了如下歌诀。五笔字型均直观,依照笔顺把码编;键名汉字打4下,基本字根请照搬;一二三末取四码,顺序拆分大优先;不足四码要注意,交叉识别补后边。,这首歌诀概括了五笔字型输入法编码的如下几项原则。(1)取码顺序依照从左到右,从上到下,从
3、外到内的书写顺序(依照笔顺把码编)。(2)按4下按键可直接输入键名汉字(键名汉字打4下)。(3)字根数为4或大于4时,按一、二、三、末字根顺序取四码(一二三末取四码)。(4)不足4个字根时,打完字根码后,补末笔字型识别码于尾部。该情况下,码长为3或4(不足四码要注意,交叉识别补后边)。(5)歌诀中“基本字根请照搬”和“顺序拆分大优先”是拆分原则,表示在拆分中以基本字根为单位并且在拆分时“取大优先”,尽可能先拆出笔划最多的字根(或者说拆分出的字根数要尽量少)。,(1)汉字字型与结构,1汉字的3种字型,同样的几个字根,同样的顺序,摆放的位置不同,就组成不同的汉字。例如:只叭 呐呙 吧邑 岂屺 由此
4、可见,字根的位置关系也是汉字的一种很有用的特征信息。从汉字结构来看,成千上万的方块汉字可分为3种类型:左右型、上下型和杂合型。,3 种字型的划分是基于对汉字整体轮廓的认识,指的是整个汉字中字根之间排列的相互位置关系。弄清这点,对于使用五笔字型输入法时,确定汉字的末笔字型识别码是十分重要的。在五笔字型输入法中,3种字型分别被赋予代号1、2、3,如下表所示。,上述3种字型的特点如下。左右型:左右型汉字包括两种情况,双合字和三合字。双合字的两个部分按左右排列,整个汉字中有着明显的界线,字根间有距离。例如,肚、胡、胆、拥、咽、枫等。虽然“咽”和“枫”的右边也由两个字根构成且这两个字根之间是外内型关系,
5、但整个汉字却属于左右字型。三合字中,整个字的3个部分从左到右并列,或者单独占据一边的一部分与另外两个部分呈左右排列,如:侧、别、谈等,都应属于左右型。,上下型:上下型汉字也包括两种情况,双合字和三合字。上下型双合字中,两个部分按上下排列,其间有一定距离,如:字、节、看等。上下型三合字中,3个部分也按上下排列,或者单独占据一层的部分与另外两部分做上下排列,如:意、想、花、型、蒋等。,杂合型:指汉字的各个字根交叠在一起,不能明显地分成上下或左右部分。这类字中多为单体、内外和包围等字型,如:团、同、圆、区、选、这、还、斗、头、飞、本、太、天、成、自、未等。,一切汉字都是由基本字根拼合而成的,基本字根
6、在组成汉字时,按照它们之间的位置关系可以分为如下4种结构。(1)单:基本字根本身即为一个汉字。如:口、木、山、田、马、用,它们被称为“成字字根”,其编码有专门的规定,不需要判别字型。(2)散:指构成一个汉字的字根不止一个,并且各个字根之间有一定的距离。上下、左右与杂合结构的汉字都可以是“散”的结构方式,如:吕、足、功、训、培、字、识、汉。,2汉字的4种结构,(3)连:五笔字型中字根间的相连关系并非相互连接之意,它主要指以下两种情况:单笔划与基本字根相连。如“丿”下连“目”成为“自”,“丿”下连“十”成为“千”,“月”下连“一”成为“且”等。其中,单笔划可连前也可连后,但是单笔划与基本字根间有明
7、显的间距都不认为相连,如:个、少、旧、孔、乞等。带点结构均认为相连。如:勺、术、太、主、斗、头。尽管这些字中的点与基本字根并不相连,但为了使问题简化,我们规定,孤立点一律视与基本字根相连。(4)交:指几个基本字根交叉套叠之后构成的汉字。例如:“申”是由“日丨”,“里”是由“日土”,“夷”是由“一弓人”交叉构成的。,(2)拆分汉字的原则,在分析汉字的结构时,是把各个基本字根组成汉字;而在录入时却要把汉字拆分成若干个基本字根,这种把汉字拆分成几个基本字根的操作,即为“拆字”。拆分汉字的原则可归纳为以下5点。,拆分“合体字”时,一定要按照正确的书写顺序进行。例:新:立 木 斤 立 斤 木 中:口 丨
8、 丨 口 夷:一 弓 大 弓,1书写顺序,“取大优先”,也叫做“优先取大”。按书写顺序拆分汉字时,应以“再添一个笔划便不再是字根”为限,每次都拆取一个“尽可能大”的,即尽可能笔划多的字根。例如:世第一种拆法:一、凵、乙 第二种拆法:廿、乙,2取大优先,在拆分汉字时,为了照顾汉字字根的完整性,有时不得不暂且牺牲一下“书写顺序”和“取大优先”的原则,形成个别例外的情况。例如:国:冂 王 丶 一 囗 王 丶 自:亻 乙 三 丿 目,3兼顾直观,能连不交指的是一个汉字能按相连的关系拆分,就不要按相交的关系拆分。例:于 一 十 不要按“二、丨”相交关系拆分。天 一 大 不能拆作“二人”,因二者相交于 一
9、 十 不能拆作“二丨”,因二者相交丑 乙 土 不能拆作“刀二”,因二者相交,4能连不交,如果一个单体结构可以视为几个基本字根的“散”关系,则不要视为“连”关系。但有时候,汉字的几个字根之间的关系在“散”和“连”之间模棱两可,此时只要不是单笔划,一律按“散”关系处理。占:卜 口(都不是单笔画,应视作上下关系)非:三 刂 三(都不是单笔画,应视作左右关系),5能散不连,(3)识别码的使用,在五笔字型编码方案中,所有的代码可以分为两类:字根码与识别码。识别码即末笔字型识别码,是为减少重码而补加的代码,它取决于汉字的末笔代码(1、2、3、4、5,对应横、竖、撇、捺、折)与汉字的字型(1、2、3,对应左
10、右、上下与杂合)。它共有53=15种组合(1113、2123、3133、4143、5153),故对应15个字母。末笔字型识别码如表所示。,如前所述,当一个字拆分后不足4个字根时,需要在打完字根码后追加一个“末笔字型识别码”,例如。,上例中,沐、汀、洒的字根码都一样(IS),但末笔划不同,所以加上末笔识别码后,它们的编码就不相同了,否则就会重码(都是IS)。同样,只、叭的字根码一样(KC),但字型不一样,所以加上字型识别码后,编码也就不相同了。,用户在使用识别码时,需注意如下几个问题。(1)关于“力、刀、九、匕”。鉴于这些字根的笔顺常常因人而异,“五笔字型”中特别规定,当它们参加“识别”时,一律
11、以其“伸”得最长的“折”笔作为末笔。例如。男:田、力(末笔为“乙”,2型)花:艹、亻、匕(末笔为“乙”,2型)(2)带“框框”的“国、团”与带走之的“进、远、延”等,因为是一个部分被另一个部分包围,我们规定:被包围部分的“末笔”作为编码的“末笔”。例如:进:二、刂、辶、川(末笔“丨”3型,加“川”作为“识别码”)远:二、儿、辶、巛(末笔“乙”3型,加“巛”作为“识别码”)团:囗、十、丿、彡(末笔“丿”3型,加“彡”作为“识别码”)哉:十、戈、口、三(末笔“一”3型,加“三”作为“识别码”),(3)“我、戋、成”等字的“末笔”遵从“从上到下”的原则,一律规定撇“丿”为其末笔。例如。我:丿、扌、乙
12、、丿(TRNT,取一二三末,只取4码)戋:戋、一、一、丿(GGGT,成字字根,先打键名,再取1、2、末笔)成:厂、乙、乙、丿(DNNT,取一二三末,只取4码)(4)单独点:对于“义、太、勺”等字中的“单独点”,离字根的距离很难确定,可远可近,我们干脆认为这种“单独点”与其附近的字根是“相连”的。既然“连”在一起,便属于杂合型(3型)。其中“义”的笔顺还需按上述“从上到下”的原则,认为是“先点后撇”。例如:太:大、丶、氵(末笔为“丶”3型,“氵”(43)即为识别码)勺:勹、丶、氵(末笔为“丶”3型,“氵”(43)即为识别码)(5)以下各字为杂合型:司、床、厅、龙、尼、式、后、反、处、办、皮、习、死、疗、压,但相似的右、左、有、看、者、布、包、友、冬、灰等可视为上下型。,6.难拆字拆分编码表,使用五笔字型输入法输入汉字时,一些难拆字最能考察用户对“五笔字型”编码规则理解和掌握的程度。对于初学者来说,这些汉字的拆分最容易弄错。,