五笔中汉字的编码以及拆分规则,那么遇到单字,偏僻字,又该如何拆分呢?分为以下几类情况: 字根码:五笔字型输入法中的编码分为字根码和识别码。前面已经介绍的汉字是由字根组成的,组成汉字的字根对应的键称为字根码。位于同一个键位上的字根的字根码一样。 字根码是汉字拆分后字根的编码。五笔字型输入的关键就是如何将汉字拆分成为字根,并将字根转换成键盘对应的字根码,然后通过键盘完成输入。 识别码:识别码一般是针对那些编码不足四码的汉字,最后补充一码作为识别码。识别码的编码是由该汉字的最后一笔笔画对应的区号与该汉字的字型代号组成区位号来取码的。五笔字型输入法中引入识别码后,大大减少了重码的输入。输入编码相同而且编码不足三码的汉字时使用识别码,基本上不需要从输入提示框中去选择汉字。 不足三码的汉字的编码方法——字根编码+识别码 补充识别码后不足四码的汉字编码方法——字根编码+识别码+空格
编码原则汉字单字的取码原则是:按照汉字拆分的原则,取汉字的第一、二、三和最后一个字根进行编码。 由两个字根组成的汉字的编码——第一个字根码+第二个字根码+识别码+空格键 由三个字根组成的汉字的编码——第一个字根码+第二个字根码+第三个字根码+识别码 由四个字根组成的汉字的编码——第一个字根码+第二个字根码+第三个字根码+第四个字根码 由四个以上字根组成的汉字的编码——第一个字根码+第二个字根码+第三个字根码+最后一个字根码 汉字拆分的关键在于一是拆分的正确性,二是识别码的判断准确。现在汉字编码中常见问题归纳如下。 字根形体相近,起笔不一样,区位不一样。如,七、匕:七起笔为一(横),匕起笔为丿(撇)。 字根形体相近,第二笔画不同,区位不同。如,戈、戋:戈位于15A,戋位于11G 汉字最后一个字根不同。如,茂、曳:茂最后一个字根为戈,曳最后一个字根为匕 书写顺序与五笔字型拆分规定不一致。如,成:最后一笔为:丶(撇),识别码为:Y 字根变形,同属一区位。如,心、?:?为心的变形,同属一区位 |