汉字的输入码 交换码 机内码 输出码的作用分别是什么 (数字代码表示汉字)

2023-03-18 7:59:47 密码用途 思思

汉字机内码(内码)(汉字存储码)的作用是统一了各种不同的汉字输入码在计算机内部的表示。

在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码。

汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。

为了将汉字的各种输入码在计算机内部统一起来,就有了专用于计算机内部存储汉字使用的汉字机内码,用以将输入时使用的多种汉字输入码统一转换成汉字机内码进行存储,以方便机内的汉字处理汉字机内码是在计算机内部存储、处理的代码。

计算机既要处理汉字,又要处理英文。因此计算机必须能区别汉字字符和英文字符。英文字符的的机内码是最高为为 0的8位ASCII码。为了不与7位ASCII码发生冲突,把国标码每个字节的最高位由0改为1,其余位不变的编码作为汉字字符的机内码。

汉字机内码的范围用二进制表示是: 10100001 10100001 11111110 11111110 机内码的高位和低位比对应的国标码的高位和低位大(128)10或(10000000)2或(80)H 即:

机内码高位 = 国标码高位 + 80H

机内码低位 = 国标码低位 + 80H

又因为:

国标码高位 = 区码 + 20H

国标码低位 = 位码 + 20H

所以:

机内码高位 = 区码 + A0H

机内码低位 = 位码 + A0H

也就是说,机内码高位和机内码低位分别比对应的区码和位码大(160)10或(10100000)2或 (A0)H 例如:汉字"啊"的区位码为"1601",其中区码为(16)10或(10)H,位码为(01)10或(01)H。则: 机内码高位 = 10H + A0H = B0H 机内码低位 = 01H + A0H = A1H 所以: 机内码= B0A1H

3) 汉字输入码(外码)

汉字输入码(外码)是为了通过键盘字符把汉字输入计算机而设计的一种编码。英文输入时,相输入什么字符便按什么键,输入码和机内码一致。汉字输入时,可能要按几个键才能输入一个汉字。汉字输入方案有成百上千个,但是这千差万别的外码输入进计算机后都会转换成统一的内码。汉字输入方案大致可分为以下4种类型:

(1) 音码:如全拼、双拼、微软拼音等

(2) 形码:如五笔字型、郑码、表形码等

(3)音形码:如智能ABC、自然码等

(4) 数字码:如区位码、电报码等

4) 汉字字形码(输出码)

汉字字形码(输出码)用于汉字的显示和打印,是汉字字形的数字化信息。汉字的内码是用数字代码来表示汉字,但是为了在输出时让人们看到汉字,就必须输出汉字的字形。

在汉字系统中,一般采用点阵来表示字形。 16 *16汉字点阵示意 16 * 16点阵字形的字要使用32个字节(16 * 16/8= 32)存储,24 * 24点阵字形的字要使用72个字节(24 * 24/8=72)存储。

一般来说,表现汉字时使用的点阵越大,则汉字字形的质量也越好,当然每个汉字点阵所需的存储量也越大。

数字表示汉字

机内码 国标码:是指我国1981年公布的“中华人民共和国国家标准信息交换汉字编码”,代号为“GB2312-80”。由连续的两个字节组成。 2.机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码 3.输入码:汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。 4.字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。 (1)区位码先转换成十六进制数表示 (2)(区位码的十六进制表示)+2020H=国标码; (3)国标码+8080H=机内码 汉字的机内码是指在计算机中表示一个汉字的编码。机内码与区位码稍有区别。汉字区位码的区码和位码的取值均在1~94之间,如直接用区位码作为机内码,就会与基本ASCII码混淆。为了避免机内码与基本ASCII码的冲突,需要避开基本ASCII码中的控制码(00H~1FH),还需与基本ASCII码中的字符相区别。为了实现这两点,可以先在区码和位码分别加上20H,在此基础上再加80H(此处“H”表示前两位数字为十六进制数)。经过这些处理,用机内码表示一个汉字需要占两个字节,分别 称为高位字节和低位字节,这两位字节的机内码按如下规则表示: 高位字节=区码+20H+80H(或区码+A0H) 低位字节=位码+20H+80H(或位码+AOH) 由于汉字的区码与位码的取值范围的十六进制数均为01H~5EH(即十进制的01~94),所以汉字的高位字节与低位字节的取值范围则为A1H~FEH(即十进制的161~254)。 例如,汉字“啊”的区位码为1601,区码和位码分别用十六进制表示即为1001H,它的机内码的高位字节为B0H,低位字节为A1H,机内码就是B0A1H。 2603 = 1A03H 区位码 + A0A0H = BAA3H 机内码 汉字的编码知识 信息编码各国有各国不同的编码,国际上统一使用的编码为ASCII(美国标准信息交换代码),我国使用的有国标码BG(中文),和BIG5(中文繁体)两种。 附带要知道:中文字库(字库文件名,大小,扩展名,存放位置) 中文输入方法(语音输入,键盘输入,手写输入,扫描输入等) 1.汉字的编码 (1)国标码:是指我国1980年公布的“信息交换汉字编码字符集”,代号为“GB2312-80”。由连续的两个字节组成。 (2)机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码。 (3)输入码:汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。 (4)字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。 编码的转换举例 汉字 区位码 16进制 国标码 机内码 文 4636 2E24H 4E44H CEC4H “文”的区位码为4636,区码和位码分别用16进制表示即为“2E24H”, 0010 1110 0010 0100转换成国标码“4E44H”,0100 1110 0100 0100机内码为“CEC4H”, 1100 1110 1100 0100 2.汉字的输入方法 汉字输入方法目前有两大类四种。 (1)键盘输入法。这是最常用的,利用各种汉字输入方法的编码敲击键盘来输入汉字; (2)非键盘输入法。目前主要有三种方法。 手写笔输入法:利用汉字识别技术,通过书写笔在感应板上书写汉字把其输入的方法。 语音输入法:利用语音识别技术,通过口说来输入汉字。 扫描识别输入,是将印或写在纸上的汉字通过扫描仪输入计算机,再经相应软件处理后转换成汉字机内码。 3.汉字字符集的概念 有两种汉字字符集。 (1)国标码字符集GB2312-80:该字符集收录了6763个常用汉字,其中一级汉字3755个,二级汉字3008个。另外还收录了各种符号682个,合计7445个。 (2)GBK汉字集:GBK即汉字扩充内码规范,又称大字符集,一共收录了20900个汉字。在Windows简体中文版中,又增加了101个补充字,一共有21001个字。它包容了GB2312-80的6763个常用汉字,台湾BIG5码收录了13000多个汉字,是目前见到的收录汉字最多的汉字系统

用数字代表汉字 0至9

0——你。

1——一、意、你。

2——爱、饿。

3——生、想、深、真、散。

4——思、输、是、死、子、世。

5——我、往、呜、舞、苦、惟。

6——啦、了、聊、老、溜、理。

7——气、妻、亲、歉、去。

8——拜、别、不、吧、帮。

9——就、走、救、加、久。

借助数字字符的谐音和寓意,将很多生活用语以数字组合的形式表达出来,写起来简单,看起来也一目了然,如:520代表我爱你、5201314代表我爱你一生一世等等。

扩展资料

数字语言从网络聊天中产生,是用数字代替词语的交流方式。根据这种约定俗成的规定,很多丰富的内容都可以通过阿拉伯数字的不同排列组合来表达。

数字语言举例

1、507680:我一定要追你。

2、540086:我是你女朋友。

3、584201314:我发誓爱你一生一世。

4、6785753:老地方不见不散。

5、7408695:其实你不了解我。

6、7708801314520:亲亲你抱抱你一生一世我爱你。

7、8834760:漫漫相思只为你。

8、9908875:求求你别抛弃我。

9、940194:告诉你一件事。

参考资料来源:百度百科-数字语言

参考资料来源:百度百科-网络语言

汉字的输入码.交换码.机内码和输出码的作用是什么??

1、输入码:将汉字输入到计算机中。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等

2、交换码:计算机内部处理的信息。计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。

3、机内码:输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。

4、输出码:于汉字的显示和打印,是汉字字形的数字化信息。

扩展资料:

这些码都是汉字编码,汉字编码的原因:

1、数量庞大:一般认为,汉字总数已超过6万个(包括简化字)。虽有研究者主张规定3000多或4000字作为当代通用汉字,但仍比处理由二三十个字母组成的拼音文字要困难得多。

2、字形复杂:有古体今体,繁体简体,正体异体;而且笔画相差悬殊,少的一笔,多的达36笔,简化后平均为9.8笔。

3、存在大量一音多字和一字多音的现象:汉语音节416个,分声调后为1295个(根据《现代汉语词典》统计,轻声39个未计)。以1万个汉字计算,每个不带调的音节平均超过24个汉字,每个带调音节平均超过7.7个汉字。有的同音同调字多达66个。一字多音现象也很普遍。

参考资料来源:百度百科-汉字编码

参考资料来源:百度百科-汉字输入码