三、五笔编码输入技巧 汉字输入是理论性和技术性都很强的课题,目前五笔字型输入法在国内外得到广泛的应用,是公认的较好的一种汉字编码输入方法。 1. 字根键位的特征 五笔字型输入法把130多个字根分成五区五位,科学地排列在25个英文字母键上便于记忆,也便于操作,其特点如下: (1)每键平均2-6个基本字根,有一个代表性的字根成为键名,为便于记忆起见,关于键名有一首"键名谱": 1)(横)区:王、土、大、木、工 2)(竖) 区:目、日、口、田、山 3)(撇) 区:禾、白、月、人、金 4)(捺) 区:言、立、水、火、之 5)(折) 区:已、子、女、又、纟 (2)每一个键上的字根其形态与键名相似。 例如:"王"字键上有一、五、戋、 、王等; "日"字键上有日、曰、早、虫等字根。 (3)单笔划基本字根的种类和数目与区位编码相对应。 例如一、二、三这三个单笔划字根,分别安排在1区的第一、二、三位置上; 丨、刂、川这三个单笔划字根分别安排在2区的第一、二、三位上等。 2.字根的区位和助记词 为了便于记忆基本字根在键盘上的位置,王永民编写了字根助记忆词。 1(横)区字根键位排列。 11G 王旁青头戋(兼)五一 (借同音转义) 12F 土士二干十寸雨 13D 大犬三羊古石厂 14S 木丁西 15A 工戈草头右框七 2(竖)区字根键位排列 21H 目具上止卜虎皮 ("具上"指具字的上部"且") 22J 日早两竖与虫依 23K 口与川,字根稀 24L 田甲方框四车力 25M 山由贝,下框几 3(撇)区字根键位排列 31T 禾竹一撇双人立 ("双人立"即"彳") 反文条头共三一("条头"即"攵") 32R 白手看头三二斤 ("三二"指键为"32") 33E 月彡(衫)乃用家衣底 ("家衣底"即"豕") 34W 人和八,三四里 ("三四"即"34") 35Q 金勺缺点无尾鱼 (指"勹、 ") 犬旁留乂儿一点夕,氏无七(妻) 4(捺)区字根键排列 41Y 言文方广在四一 高头一捺谁人去 42U 立辛两点六门疒 43I 水旁兴头小倒立 44O 火业头,四点米 ("火"、"业"、"灬") 45P 之宝盖,摘礻(示)(衣) 5(折)区字根键位排列 51N 已半巳满不出己 左框折尸心和羽 52B 子耳了也框向上 ("框向上" 指"凵") 53V 女刀九臼山朝西 ("山朝西"为"彐") 54C 又巴马,丢矢矣 ("矣"丢掉"矢"为"厶") 55X 慈母无心弓和匕 幼无力 ("幼"去掉"力"为"幺") 3.Z键的用法 从五笔字型的字根键位图可见,26个英文字母键只用了A-Y共25个键,Z键用于辅助学习。 当对汉字的拆分一时难以确定用哪一个字根时,不管它是第几个字根都可以用Z键来代替。借助于软件,把符合条件的汉字都显示在提示行中,再键入相应的数字,则可把相应的汉字选择到当前光标位置处。在提示行中还显示了汉字的五笔字型编码,可以作为学习编码规则之用。 四、提高输入速度的方法 五笔字型一般敲四键就能输入一个汉字。为了提高速度,设计了简码输入和词汇码输入方法。 1.简码输入 (1)一级简码字。 对一些常用的高频字,敲一键后再敲一空格键即能输入一个汉字。高频字共25个,如下图键左上角为键名字,键右下角为高频字即一级简码字。 (2)二级简码字。 由单字全码的前两个字根代码接着一空格键组成,最多能输入25×25=625个汉字。 (3)三级简码字。 由单字前三个字根接着一个空格键组成。凡前三个字根在编码中是唯一的,都选作三级简码字,一共约4400个。虽敲键次数未减少。但省去了最后一码的判别工作,仍有助于提高输入速度。 2.词汇输入 汉字以字作为基本单位,由字组成词。在句子中若把词作为输入的基本单位,则速度更快。五笔字型中的词和字一样,一词仍只需四码。用每个词中汉字的前一、二个字根组成一个新的字码,与单个汉字的代码一样,来代表一条词汇。词汇代码的取码规则如下: (1)双字词:分别取每个字的前两个字根构成词汇简码。 例如:"计算"取"言、十 、目"构成编码(YFIH); (2)三字词:前二个字各取一个字根,第三个取前二个字根作为编码。 例如:"操作员"取"扌、亻、口、贝"构成一个编码(RWKM);"解放军"取"刀、方、冖、车"作为编码(QYPL)等等。 (3)四字词:每字取第一个字根作为编码。 例如:"程序设计"取"禾、广、言、言"(TYYY)构成词汇编码。 (4)多字词:取一、二、三、末四个字的第一个字根作为构成编码。 例如:"中华人民共和国"取"口、人、人、口"(KWWL),"电子计算机"取"日、子、言、木"(JBYS)等。 五笔字型中的字和词都是四码。因此,词语占用了同一个编码空间。之所以词字能共同容纳于一体,是由于每个字四键,共有25×25×25×25种可能的字编码,约39万个,大量的码空闲着。 对词汇编码而言,由于词和字的字根组合分布规律不同,它们在汉字编码空间中各占据着基本上互不相交的一部分。因此词和字的输入完全一样。 3.重码与容错 如果一个编码对应着几个汉字,这几个称为重码字;几个编码对应一个汉字,这几个编码称为汉字的容错码。 在五笔字型中,当输入重码时,重码字显示在提示行中,较常用的字排在第一个位置上,并用数字指出重码字的序号,如果你要的就是第一个字,可继续输入下一个字,该字自动跳到当前光标位置。其他重码字要用数字键加以选择。 例如:"嘉"字和"喜"字,都分解(FKUK),因"喜"字较常用,它排在第一位,"嘉"字排在第二位。若你需要"嘉"字则要用数字键2来选择。 为了减少重码字,把不太常用的重码字设计成容错码字即把它的最后一码修改为L,例如:把"嘉"字的码定义为FKUL,这样用FKUL输入,则获得唯一的"嘉"字。 在汉字中有些字的书写顺序往往因人而异,为了能适应这种情况,允许一个字有多种输入码,这些字就称为容错字。在五笔字型编码输入方案中,容错字有500多种。 五笔学习4--怎样找字根 (一)、字根设计及键位分区划位的规律性,使得初学者可以参考以下方法很快地在键盘上找到所要的字根。 字根,是由若干笔划交叉连接而形成的相对不变的结构叫字根。五笔字型中优选了130种基本字根,分五大区,每区又分五个位。 一区∶横起笔类 27种,分"王土大木工"五个位; 二区∶竖起笔类 23种,分"目日口田山"五个位; 三区∶撇起笔类 29种,分"禾白月人金"五个位; 四区∶捺起笔类 23种,分"言立水火之"五个位; 五区∶折起笔类 28种,分"已子女又纟"四个位; 1、依字根的第一个笔画(首笔)可找到字根的区(只有几个例外)如:"王、土、大、木、工、五、十、古、西、戈"的首笔为横(代号为1),它们都在第1区。"禾、白、月、人、金、竹、手、用、八、儿"的首笔为撇(代号为3),它们都在第3区。 2、 依字根的第二个笔画(次笔)一般来说,可找到位。 如:"王、上、禾、言、已"的第二笔为横(代号为1),它们都在第1位。"戈、山、夕、之、纟"的第二笔为折(代号为5),它们都在第5位。 3、 单笔画及其简单复合笔画形成的字根,其位号等于其笔画数。 如:"一、丨、丿、丶、乙":都在对应区的第1位"二、 、 、冫、 ":都在对应区的第2位"三、 、彡、氵、巛":都在对应区的第3位。 4、少数例外:有4个字根,即:力、车、几、心,它们既不在前2笔所对应的"区"和"位",甚至也不在其首笔所对应的"区"中,实在是因为它们在对应的"区"、"位"里,引起"窝里斗"(引起大量重码),不受欢迎,只得流落他乡。好在这样的字根只有4个,凭借某种特征,也算容易记住。 例如:"力":读音为LI,故在"L"(24)键上,也说得过去。"车":其繁体字" "与"田、甲"相近,与"田、甲"(24·L)呆在一起,也能四邻皆安。"几":外形与"冂"相近,二者放在一个键(25·M)上也算有个伴。"心":其最长的一个笔画为"乙",放在"51·N"键 上,总有点沾亲带故。 (二)、按字根是否为汉字来分两大类。 第一类:其本身是汉字的字根 字串5 ━━ 汉字字根 ━━ 有98个 第一类又分"键名字根"、"汉字字根"、"单笔字根"三小类。 1.键名字根 ━━ 有25个 金、木、水、火、土,日、月、立、山、田,子、女、已、大、人,王、工、口、又、言,白、目、禾、之、纟。 2.汉字字根 ━━ 有68个 二犬三豕手辛门,四川巴雨广西米;五士用上古马车,廿七八九羽六十; 夕匕弓皿乃干戈,儿曰己巳也了耳;寸丁卜止几斤力,竹刀早戋孑虫尸。 小方由心臼石厂,弋幺甲贝文。 3.单笔字根 ━━ 有5个 一、丨、丿、丶、乙 。 第二类:其本身不是汉字的字根 ━━ 非汉字字根 ━━ 有136个 第二类又分"部首字根"与"复笔字根"两小类。 1.部首字根 ━━ 有32个 艹囗匚冂,彳攵亻刂廾彡夂扌钅勹;廴宀辶亠讠冫疒氵灬丬冖,忄巛厶彐卩凵阝。 2.复笔字根 ━━ 有104个 1青、2革、2于、1肆、2羚、2羊、1有、1百、1尤、1要、2末、1板、1共、1东、2走、 1此、1占、1具、1皮、1虎、1临、1归、2齐、3而、4临、2带、1黑、2曾、3舞、1罢、 1周 归类: (一级简码字根字)一了上工人 字串5 (二级简码字根字)五方大子立之水止 (三级简码字根字)纟言禾田月白山女王又火, (四级码字根字) 日口目已金木土。 (一级键名字根字)一了上工人 (二级键名字根字)二三四五六七九,早用车马力,由米也方心,小儿几手刀止 (三级键名字根字)羽弓己古耳匕巴,竹皿厂---门丁廿、斤卜乃十八。 (四级键名字根字)辛巳寸雨夕,戈戋曰广西:川干石犬贝,文士甲虫尸 易混淆字根 在拆字过程中,有些字根总是弄混,比如"七"和"匕",长得就很像。下面我们就专门讲一下这些形状相似,容易混淆的字根。 (1)"七"和"匕"、""和""去掉两点余下的部分、" "和"冖"。 这几组字根很相似,拆分时要注意它们的起笔不同,所在区位与起笔有关。 比如"七"起笔是横,所以在1区,而"匕"起笔是折,在5区。这样输入"龙"字时,起笔为撇,在3区,所以看字编码为RHF,而"着"字第二个字根起笔为横,在第1区,所以就取羊字底,编码UDH。 我们再看"军"和"角",比较好区分。"冖"起笔是点,在4区的P键位上;而" "起笔是撇,在第3区的Q键位上。 (2)"戋、戈、弋"它们都在同一区,只是位号有所不同,在拆分汉字时要按字根次笔笔画来区分。比如:"代、伐、钱"三个字中有一个形近字根,分别为"弋、戈、戋","弋、戈"次笔都是折,所以在5位上,区位号15;"戋"次笔为横,所以在1位上,区位号11。 (3)"晓、曳、茂"这几个字由于斜钩部分起笔的笔画不同。所以选择字根也不一样。 "晓":该字的斜钩部分由横、斜钩、撇组成,与字根"戈"很像,但少了一点,不能当"戈"来处理,该部分与"七"很像,按取大优先的原则,就取一字根,所以"晓"可以拆分为:"日、七、丿、儿",编码为JATQ。 "曳":该字的斜钩部分由斜钩、撇组成,与"匕"相似,按取大优先原则,把它看做是"匕"的变形字根,"曳"就拆分为"日、匕",识别码33,编码JXE。 "茂":该字的斜钩部分也是由斜钩、撇组成,但不能取"匕"作为变体字根,因为这个字的末笔还有一个点,在五笔中,规定这类汉字结构的字一般以撇作为末笔,这个字的斜钩部分就变成了斜钩、点、撇,所以不能取"匕",而取折作为字根,"茂"字拆为"艹、厂、乙、丿",编码ADNT。 这几个字不太好区分,这样的字也不太多,最好的办法只有硬记一下这几个字的拆法。 (4)"勹"和"卩"字根的变形。 "敖":该字的第二个字根笔画与字根"勹"相似,按取大优先的原则,取第二个字根为"勹"的变体。这样"敖"字拆分为"、勹、攵",编码为GQTY。类似的字还有"傲、遨"等。 "予":该字上面是字根"",第二个字根与"卩"很像,所以把"予"拆分为"、卩",编码为CBJ。类似的还有"矛、预、柔"等。