机内码和国标码什么意思,怎么转换(汉字国标码转为机内码)

2023-03-04 14:05:40 密语知识 思思

机内码是汉字在计算机内部使用的编码,国标码是在中国大陆使用最广泛的汉字编码字符集。其转换规则是:机内码是将国标码的每个字节都加上128,即将两个字节的最高位由0改1。

汉字分为输入码、区位码、国标码与机内码。

机内码是国家标准局颁布的《信息交换用汉字编码字符集基本集》(代号为GB231280)规定的汉字交换码作为国家标准汉字编码,是汉字在计算机内部存储、传送、交换的内部编码。

国标码是中国汉字通行的国际标准为我国于1981年制订的“信息交换用汉字编码字符集”,其标准号为GB2312—80,简称国际码,是我国应用最广泛的汉字编码字符集。

国标码(“国标”是中华人民共和国国家标准的简称)在中国大陆使用。GB2312收录6763个汉字,GBK收录20912个汉字,最新的GB18030收录27533个汉字。

汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变。

例如:“保”字的国标码为3123H,前字节为00110001B,后字节为00100011B,高位改1为10110001B和10100011B即为B1A3H,因此,“保”字的机内码就是B1A3H。

扩展资料:

区位码转换为国标码的方式:

国标码是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码有一个相对位置差的代码,再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。

如:“保”字的国标码为3123H,它是经过下面的转换得到的:1703D-1103H-+20H-3123H。

参考资料来源:百度百科-机内码

参考资料来源:百度百科-国际码

汉字国际码转内码

机内码=国标码+8080H。

即:5E48H+8080H=DEC8H。

国标码的机内码为二字节长的代码,它是在相应国标码的每个字节最高位上加“1”,即

汉字机内码=汉字国标码+8080H

例如,“啊”字的国标码是3021H,其汉字机内码则是B0A1H。

汉字机内码的基础是汉字国标码。

扩展资料:

国际码编码规则:

汉字用两个字节表示,原则上,两个字节可以表示 256×256=65536 种不同的符号,作为汉字编码表示的基础是可行的。

但考虑到汉字编码与其它国际通用编码,如ASCII 西文字符编码的关系,我国国家标准局采用了加以修正的两字节汉字编码方案,只用了两个字节的低7位。

这个方案可以容纳 128×128=16384 种不同的汉字,但为了与标准ASCII码兼容,每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码。

所以每个字节只能有94个编码。这样,双七位实际能够表示的字数是:94×94=8836个

机内码编码原则:

汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变。

如:我们知道,“保”字的国标码为3123H,前字节为00110001B,后字节为00100011B,高位改1为10110001B和10100011B 即为B1A3H,因此,“保”字的机内码就是B1A3H。

参考资料来源:百度百科-机内码

机内码和国标码如何转换?

区位码、国标码与机内码的转换关系

(1)区位码先转换成十六进制数表示

(2)(区位码的十六进制表示)+2020H=国标码;

(3)国标码+8080H=机内码

举例:以汉字“大”为例,“大”字的区内码为2083

解:1、区号为20,位号为83

2、将区位号2083转换为十六进制表示为1453H

3、1453H+2020H=3473H,得到国标码3473H

4、3473H+8080H=B4F3H,得到机内码为B4F3H小结:字符编码的两种表示方式:ASCII(字符的表示);GB2312(国标码,汉字编码)