王码五笔输入法教程内容简介本教程是依据王码五笔的汉字编码方案,参阅了相关的书籍资料,并经过整理汇编而成的。
本教程从汉字的结构开始,依次从笔画、字根、汉字、简码和词组的角度,进行逐步讲解,可供初学者使用。
由于编写时间有限,书中难免有不足之处,还望大家多提意见。
编者著2012年4月29日本教程学习要点如下:掌握相关字根的基本分布及编码,并会拆分汉字掌握简码与词组的录入知道汉字的笔画和拆分原则了解五笔输入法的简介五笔输入法的简介五笔输入法,全称王码五笔输入法,是1983年由河南省中文信息研究会的王永民教授研究出来的一种汉字输入法,是我国目前应用最广,速度最快,同时也是在国外影响最大的汉字输入技术。
人们常说的五笔86版,98版,18030版,被称之为王码五笔输入法。
王码可以说是五笔的正宗。
其他的如极点五笔,万能五笔,海峰五笔,智能五笔,可以说是高级五笔,个性五笔,有各自的发明人,但基本上都是以五笔86版为编码标准的。
会五笔86版的,就能用这些五笔。
五笔输入法有以下优点:重码率低,词组多,准确度高,便于盲打,输入速度快,完全根据汉字的字形结构来进行编码,与汉字读音没有任何关系。
也就是说,你即使是碰到一个不会念的汉字,只要知道它怎样写,分成几部分,就可以将其输入计算机。
因此它是现在很多公司指定的输入法。
汉字的结构汉字可划分为三个层次,即笔画、字根、汉字。
也就是说由若干笔画复合连接交叉形成相对不变的结构组成字根,再将字根按一定的位置关系拼合起来就构成了汉字。
汉字的笔画书写汉字时,一次不间断地连续写成的一个线段,叫做汉字的笔画,它是汉字结构的最小单元。
根据五笔字型对笔画的定义,只考虑笔画的运笔方向,而忽略其轻重长短,则汉字中的各种笔画可以归纳为五种:横、竖、撇、捺、折。
将这五种笔画称为五种基本笔画,依次用1、2、3、4、5作为它们的代号。
笔画间的关系五种笔画组成字根时,笔画间的关系可以分为以下4种情况:(1)单:五种笔画自身(2)散:组成字根的笔画之间有一定间距(三、八)(3)连:组成字根的笔画间是相互连接的(厂、人、尸、弓)(4)交:组成字根间的笔画是相互交叉的(十、力、又、车)注:特殊情况下(混合),笔画之间有散有连(雨、禾)。
掌握笔画间的关系,对非基本字根的拆分和“识别码”的取法非常有利。
五笔字根由笔画交叉连接而形成的相对不变的结构通称为偏旁、部首,五笔字形中称为字根。
字根既可以是汉字的偏旁部首,也可以是部首的一部分,甚至是笔画。
五笔字型方法中经过大量统计和反复试用最后优选了130个字根,这些字根可以按较为统一的规则拼形组成汉字。
这130个基本字根按起笔的笔画分为5大区,每区内又分为5个位,十位数为区号,个位数为位号。
以11-55共计25个代码表示。
这就是“五笔字型”汉字编码方案的字根总表。
只有这130个字根才有资格参加编码。
其它任何形态的笔画结构,都要全部理解为是由这130种基本字根组成的,这130种字根又分为键名字,笔形和基本字根三种,统称为基本字根。
第一区: 11-G王旁青头戋(兼)五一,("兼"与"戋"同音)12-F土士二干十寸雨。
13-D大犬三羊古石厂,("羊"指羊字底)14-S木丁西,15-A工戈草头右框七。
("右框"即"匚")第二区: 21-H目具上止卜虎皮,("具上"指具字的上部)22-J日早两竖与虫依。
23-K口与川,码元稀,24-L田甲方框四车力。
("方框"即"囗")25-M山由贝,下框几。
第三区: 31-T禾竹一撇双人立,("双人立"即"彳")反文条头共三一。
("条头"即"夂")32-R白手看头三二斤,33-E月彡(衫)乃用家衣底。
("家衣底"即"豕、 ")34-W人和八,三四里,("人"和"八"在34里边)35-Q金勺缺点无尾鱼,(指"勹、 ")犬旁留叉儿一点夕,( 指" " 、儿、 ")氏无七(妻)。
("氏"去掉"七")第四区: 41-Y言文方广在四一,高头一捺谁人去。
(高头" ","谁"去"亻" 为"讠、 ")42-U立辛两点六门疒,43-I水旁兴头小倒立。
(指"氵、 、 、 ")44-O火业头,四点米,("业头"即" ")45-P之字军盖建道底,(即"之、宀、冖、廴、辶")摘礻(示)衤(衣)。
("礻、衤"摘除末笔画即" ")第五区: 51-N已半巳满不出己,左框折尸心和羽。
("左框"即" ")52-B子耳了也框向上。
("框向上"即"凵")53-V女刀九臼山朝西。
("山朝西"即"彐")54-C又巴马,丢矢矣,("矣"去"矢"为"厶")55-X慈母无心弓和匕,("母无心"即" ")幼无力。
("幼"去"力"为"幺")五笔字型字根优先原则:组字能力强,在日常汉语文字中出现次数多。
这些字根可以按较为统一的规则拼形组成汉字(或者说汉字可以按较统一规则拆分为基本字根的确定组合)汉字的三种结构在成千上万的广场汉字中,可分为三种类型,即左右型、、上下型与杂合型。
三种字型的划分是基于对汉字整体轮廓的基本认识,是指整个汉字中字根之间排列的相互位置关系。
搞清这一点,对于确定多字根的汉字的类型是十分重要的。
注:(1)凡是字根组合为相连结构的,一律视为杂合型(2)凡是单字字根,有单独的编码方法,无须利用字根信息(雨、寸、六)(3)对于散、交两类字根组合,要注意区分字型。
汉字的拆分原则取大优先:在各种可能的拆分中,保证按书写顺序拆出尽可能大的字根(草)兼顾直观:在拆分时,照顾字根的完整性(因)能连不交:在拆分时先连后交(郑、于)能散不连:指拆分时先散后连,并且还应注意,一个笔画不能割断用在两个字根中(占、果)不妨再加4句,为:单句须拆,散拆简单。
难在交连,笔画勿断。
取大优先,兼顾直观。
能连不交,能散不连。
五笔字根的汉字编码录入为了便于掌握,将五笔字型取码规则编成如下口诀五笔字形均直观,依照笔顺把码编;键名汉字打四下,基本字根请照搬。
一二三末取四码,顺序拆分大优先;不足四码要注意,交叉识别补后边。
末笔画字形交叉识别码末笔识别码只是在汉字录入时不足四码时才使用。
简码和词组为了简化输入,提高大家打字的速度,追求更高的效率,下面我们开始学习简码和词组的输入。
简码简码按其编码长度分类,分为一级简码、二级简码和三级简码(注:四码的叫全码)一级简码。
一级简码又称为高频字,以在文章中出现频率高而得名。
在键盘上,从11键到55键。
共有25个键位代码。
五笔字形中根据每个键位上的字根特征,每个键上都安排了一个最常用的高频汉字,共25个汉字。
在输入这类汉字时,只需要击一次对应字母键,再击一次空格,即可输入。
二级简码。
五笔字型将位于汉字频度表中前面的常用字定为二级简码,是由25个键位代码排列组合而成的。
25×25=625,去掉一些没有的空字,共589个,占整个汉字频度的60%。
在输入这类汉字时,只需输入该汉字的前两个字根,再打一个空格键即可。
三级简码。
三级简码共需输入该汉字的前三个字根码,再打一个空格键即可。
三级简码大约有4400多个汉字,输入时分下列两种情况:(1)三个或多于三个字根(第一字根+第二字根+第三字根+空格)如:些、郑。
(2)二个字根(第一字根+第二字根+末笔识别码+空格)如:里、青。
三级简码看上去击键次数虽仍为,没有减少总的击键次数,但由于省略了前3个字根之后的字根判定或者交叉识别码的判定,因而可达到提高编码速度、加快输入的目的。
注:有时,同一个汉字在五笔字形中可能有多种编码方式。
对于这种情况,在录入文章时,要使用它最简化的输入码键入,以提高录入速度。
例如“经”字,有一级简码、二级简码、三级简码和全码四种输入编码。
词组词组的输入,非常有利于加快打字的速度。
在五笔中,词组分为二字词、三字词、四字词和超过四个字的词四种,这四种词组的编码规则如下:二字词:各取前两个字根码(计算、机器、汉字、时间)三字词:前两个字取第一个字根码,第三个字取前两个字根码(计算机、操作员)四字词:每个汉字的第一个编码(社会主义、程序设计)四字以上的词(多字词):前三个字和最后一个字的第一个字根码(中华人民共和国、五笔字型计算机汉字输入技术、中央电视台)重码和容错码重码。
在五笔字型中,可能有几个不同的汉字或词组使用了相同的编码,这种现象叫作重码。
对于重码字,按照使用频度不同,作了分级处理。
在输入汉字时若遇到重码字,中文提示行上将会把最常用的那个字或词排在第一位,并按级别显示出全部的重码字或词组来供用户选择(例:去、支、云的编码为FCU,信息、住处、登记处的编码为WYTH)*容错码(不常用)容错码有两种含义,一是容易搞错,二是允许用户犯错。
容错码分为以下几种类型“拆分容错、字形容错、软件版本容错、异体容错、末笔容错、笔顺容错、繁简容错等。
*学习键(万能键Z)在五笔字形中,Z键又称为万能键,其作用是可以代表任一字根码或识别码。
如果用户在输入汉字时忘了其中某一个编码,按一下Z键,系统就会显示出所有可能符合输入条件的字和词,方便用户选择。
理论知识的学习到此就告一段落,接下来就要靠大家的练习了。