当前课程知识点:计算机文化基础 > 第3课:数字世界中形形色色的“数” > 换一种思路来数字化文本信息 > 机内码是如何产生的
通过前面的介绍我们知道
通过采样和量化
实现图像和声音的数字化
让计算机能够识图
也能够听音
那识字呢
文本信息的数字化
也能采用同样的方法吗
理论上是没有问题的
就像这样我们可以把每一个字母
每一个汉字
每一种语言对应的符号的外观
采用记录的方式
进行数字图像的一个处理
让计算机通过识图的方式
来识字
这有什么不同吗
想一想
这样做最突出的问题是
在文字处理时
编辑空间被大大的压缩了
不能设置字体
字号大小也受到了限制等等
所以为了获得更大的编辑空间
计算机需要换一种思路
来识字
我们通过对每一个字母
每一个汉字
每一种语言对应的符号
一一用二进制的数串
来进行唯一的编码
比如1000010
它的唯一来表示了字母B
在计算机中的存储和使用的
二进制的形式
这些二进制数串
就是字符对应的机内码
计算机通过机内码的方式
识字
在这里我们还注意到一个现象
那就是每一个字符
对应唯一的机内码
而英文字母和汉字字符的编码长度
还不一样
机内码它就成为了
文本信息数字化的
中间的桥梁
那我们看文本与图像 声音的不同
后者我们多采用一种
数码记录装置
将看到的
听到的
以数字方式
直接拍摄下来
录制下来
而文本信息
我们需要通过某种输入手段
来转换为机内码
比如我们以英文的键盘输入为例
我们就可以看到
在输入汉字的时候
它有各种各样的输入法
最常用到的拼音输入法
还有不少同学在中小学阶段
接触过的五笔字型输入法等等等等
那么到了显示阶段的话
我们又需要字形码
它为了将计算机在显示器上
在打印机上输出
让我们看到
计算机文字处理的结果
引入的一种手段
那么机内码
它是如何产生的呢
前提有两个
一个就是字符集
一个就是字符编码
字符集是各种文字和符号的总称
包括各个国家的文字
标点符号
图形符号
数值符号等等
常见的字符集有
ASCII编码所对应的ASCII字符集
以及我们看到的简体中文国标码
像GB2312字符集
GB18030字符集
而对于繁体字
我们还有对应的
繁体的中文的
大5码 BIG5字符集
还有呢就是为了在各个国家语言当中
进行交换
囊括了人类文明涉及到的
各种语言文字符号的Unicode字符集
那么字符编码呢
字符编码实际上就是一套
人为的规定的
这样的一个转换法则
在字符集和二进制的数字系统之间
建立起对应的关系
将字符集中的每一个符号
一一用二进制数串
进行唯一的编码
转换成对应的机内码
那我们通过ASCII 编码
来了解一下机内码
是如何在某个明确的
字符集的基础上
通过一定的编码规则
来生成的
ASCII这就是美国信息交换标准代码
英文缩写ASCII
我们可以看到
在这个字符集当中
它包括了0到9
10个数字
大小写的英文字母52个
还有一些标点符号
和专用的符号
其中95个是看得见的字符
还有33个是看不见的控制字符
比如说我们的Ctrl
shift或者是退格这个删除键
这一类热键或功能键
一共是128个符号
它都需要用0101这样的二进制数串
来排列组合
进行编码
那么它就需要7个比特
来进行编码
也就是2的7次方
这等于128位
那好了
那我们就来看一下
如何对ASCII码字符集中的字符
进行编码呢
其实它的编码是叫做
人为实现的
只要人为实现一一对应就可以了
比如我们看ASCII码字符集
它就放在了这样的一个表当中
8×16的这样一个表
正好把128个字符
放到这样的一个表里
那我们就可以来看看
按照这4个步骤
把小写的字母a
它的ASCII编码
1100001
把它转换出来
所以首先我们在这个列表当中
找着了小写的字母a
它在这个里边的第七列
7转换成二进制是110
所以它就把这110
这样的列号取出来
变成它的高位
然后又对应在它的这个阵列当中
找到它所在的行号
第二行
那就是0001
那把它再取出来
拼到后边
一共组成了7个比特的
二进制的数串
我们就用查表的方式
就把这个a字母的ASCII码查了出来
那么汉字的编码
它就类似ASCII编码
不同的是ASCII字符集很小
它有128个字符
编码长度只需要用7个比特
就能够完成
所以我们又常常把ASCII编码
称作叫单字节编码
那么汉字字符集的规模数量值
可不是几百几千
而是上万
即使要把单个字节的
8个比特全都用足
那它也只能够表示2的8次方
256个
所以汉字编码
它得用两个字节来编码
所以我们说这是双字节的字符编码
最早的这个字符集
我们称之为叫GB2312
这是在1980年
由中国国家标准总局发布的
所以我们看到的GB这两个字
就代表了国标码的含义
是国家标准的含义
GB2312
它一共收录了
一级汉字
3755个
二级汉字
3008个
它怎么来管理它的呢
也是按刚才那样做成一个大表
不过它进行了一个分区
一共分成了94区
和94位
我们来举一个例子来看
我们可以看到汉字这个中
它就处在了
这个区位码当中的
54区
在54区当中
又排列在了第48位
所以我们就可以看到
这个GB2312它的编码
按区位码来编写
中它就是5448
转换成二进制
那就是这样的一个二进制数串
这就是中在GB2312的编码下
它的机内码
讲到这里
主要我们就是通过认识机内码
来建立字符集
和编码的概念
前者我们决定了计算机
要认识的字符的范围
而后者则是一个一一对应的
人为编码规则
好休息一下
我们再回来
-由一个短片引出......
-梳理IT产业大脉络(上)
-梳理IT产业大脉络(下)
-你的第一门计算机入门课
--课程介绍及要求
-实践:图像处理入门
--实践小作业要求
--操作前的几点准备
-第1课习题作业
-第1课导学帖
--第1课导学帖
-现代计算机为什么是电子数字的?
-二进制与十进制有什么区别?
--了解二进制
-为什么莱布尼兹没有认识到二进制的重要性?
--与、或、非
-从ENIAC到现代通用计算机
--新材料带来新发展
-摩尔定律会失效吗?
--摩尔定律失效
-讲座:计算机世界中的巨无霸
-参观:感受世界巨无霸(太湖之光)
--神威太湖之光简介
--探秘神威太湖之光
-参观补充:走进济南国家超算中心
--走进国家超算中心
-实践:我的计算机有多快?
-第2课习题作业
-第2课导学帖
--第2课导学帖
-数码相机是如何“计算”出一张数字照片?
--如何拍摄彩色照片
-认识图像数字化过程中的采样和量化
--采样和量化
-计算机是如何感知声音波形的?
--声音量化三要素
-换一种思路来数字化文本信息
--字符集的发展历程
-实践:常用网络资源下载
--常见下载方法介绍
--常见文件类型下载
- 第3课习题作业
-第3课导学帖
--第3课导学帖
-软件解决的目标是什么?
--软件的目的是什么
-我们使用的软件是怎么来的?
--软件是怎么来的1
--软件是怎么来的2
-操作系统拥有什么样的神力?
--操作系统的演变1
--操作系统的演变2
--CPU的管理调度
--虚拟存储技术
-访谈:如何成功研发一款手机APP
-实践:如何利用注册表进行系统优化
--注册表概述
--注册表与信息安全
-第4课习题作业
-第4课导学帖
--第4课导学帖
-数字存储前言
--梳理数字存储历史
--磁、光存储介质
--半导体存储介质
-怎样在存储介质上表示1和0?
-怎样从存储介质读取1和0?
-如何找到所需的数据?
-实践:文章排版基本技能
--引言
--中文输入
--图文混排
--页面设置
--利用表格布局标题
--分栏和首字下沉
--设置页眉与页脚
--设置插图润色排版
--LaTeX入门
-第5课习题作业
-第5课导学帖
--第5课导学帖
-演示文稿制作准备
--操作前的几个概念
--实践前的环境准备
-制作演示文稿
--设置超链接按钮
--设置超链接文本
-作品赏析
-第6课习题作业
-第6课导学帖
--第6课导学帖
-联网目的和资源共享模式的变迁
--资源共享模式
--异构网互联
-物联网连入互联网
--互联网与因特网
-访谈:PC在智能穿戴生态系统中的定位
--对话联想(上)
--对话联想(下)
-参观:联想创新中心掠影
--探秘联想创新中心
-第7课习题作业
-第7课导学帖
--第7课导学帖
-从网络组织来描述计算机网络
--计算机网络的定义
--网络软件
-从功能角度来认识计算机网络
--网络体系结构
--IPv4(上)
--IPv4(下)
--IPv6
-实践:网络不通怎么办
--网络连接
-第8课习题作业
-第8课导学帖
--第8课导学帖
-认识图像传感器
--认识图像传感器
--图像传感器的应用
--图像传感器的市场
-图像传感器的应用
--在汽车中的应用1
--在汽车中的应用2
--物联网中的应用
-了解图像传感器技术
--图像传感器的技术
-图像传感器的挑战
--问题与挑战
-讲座:如何在大数据中精准生活
--走进大数据
--生活中的大数据
-实践:HTML入门实践
--HTML作业要求
--HTML基本标记
--综合样例(上)
--综合样例(下)
-第9课习题作业
-第9课导学帖
--第9课导学帖
-认识搜索引擎
--这就是搜索引擎
-信息检索背后的关键技术
--海量数据的获取
--搜索结果排名
-搜索引擎的未来
--情境感知的搜索
--社会化搜索
--智能搜索
-实践:Aminer学术搜索
--Aminer介绍
-第10课习题作业
-第10课导学帖
--第10课导学帖
-信息安全的基本要求
--早期的计算机安全
-新型的网络攻击有哪些
--信息泄露
--移动安全
-未知攻 焉知防
--未知攻焉知防
--未知攻焉知防2
--信息加密
--安全防范原则
-实践:Excel实践
--实例操作
--实例操作2
--实例操作3
--绘制图表
-第11课习题作业
-第11课导学帖
--第11课导学帖
-回顾与展望
--回顾与展望1
--回顾与展望2
--回顾与展望3
--回顾与展望4
-什么是计算
--什么是计算
-访谈:信息技术交叉应用
--对话风投专家1
--对话风投专家2
--对话风投专家3
-嘉宾分享:闲谈数字产业创新
-第12课习题作业
-第12课导学帖
--第12课导学帖