当前所在位置:珠峰网资料 >> 计算机 >> 计算机等级考试 >> 正文
2015年计算机三级考试PC技术基础知识(3)
发布时间:2012/4/28 16:11:32 来源:城市网学院 编辑:ziteng
  -
  三、字符和文本的暗示
  (一)西文字符的编码
  西文是由拉丁字母、数字、标点符号及一些非凡符号所组成的,它们统称为“字符”(Characˉter)。所有字符的集结叫做“字符集”。字符集中每一个字符各有一个代码(即字符的二进制暗示),它们互相区别,组成磷泼字符集的代码表,简称码表。
  今朝计较机中使用得最普遍的西文字符集及其编码是ASCII码,即美国尺度信息交流码(American Standard Code for Information Interchange)。它已被国际尺度化组织(ISO)核准为国际尺度,称为ISO-646尺度,它合用于所有拉丁文字字母,已在全世界通用。我国响应的国家尺度是GB1988(称为《信息措置交流用的七位编码字符集》尺度)。
  (二)汉字的编码
  1.GB2312-80汉字编码
  1981年我国公布了《信息交流用汉字编码字符集·根基集》(GB2312-80)。该尺度选出6763个常用汉字和682个非汉字字符,为每个字符划定了尺度代码,以供这7445个字符在分歧计较机系统之间进行信息交流使用。这个尺度所收集的字符及其编码称为国际码,又叫做国际交流码。
  2.BIG5汉字编码
  BIG5汉字编码是我国台湾地域计较机系统中使用的汉字编码字符。它包含了420个图形符号和13070个汉字(不使用简化汉字)。
  3.汉字的输入/输出
  (1)汉字的输入
  汉字输入编码体例大体分成4类。①数字编码,这是一类用一串数字来暗示汉字的编码体例,例如电报 码、区位码等,它们难以记忆,不易推广。②字音编码,这是一种基于汉语拼音的编码体例,简单易学,适合于非专业人员。错误谬误是同音字引起的重码多,需增添选择操作。③字形编码,这是将汉字的字形分化归类而给出的编码体例,重码少、输入速度快,但编码轨则不易把握,五笔字形法和表形码就是这类编码。④形音编码,它吸收了字音编码和字形编码的利益,使编码轨则简化、重码削减,但把握起来也不轻易。
  汉字输入编码与汉字内码、汉字交流码美全是分歧规模的概念,不能把它们同化起来。
  (2)汉字的输出
  每一个汉字的字形都必需预先存放在计较机内,一套汉字(例如GB2312国标汉字字符集)的所有字符的外形描述信息集结在一路称为字形信息库,简称字库(font)。分歧的字体(如宋体、仿宋、楷体、黑体等)对应着分歧的字库。在输出每一个汉字的时假,计较机都要先到字库中去找到它的字形描述信息,然后把字形信息送去输出。
  在计较机内汉字的字形首要有两种描述的体例:点阵字形和轮廓字形。
  Windows中使用的TrueType字库采用的就是典型的轮廓字形暗示体例。点阵字形和轮廓字形这两种类型的字库今朝都普遍使用。 [NextPage]   (三)通用编码字符集(UCS)与Unicode
  1.通用编码字符集(UCS)
  ISO/IEC10646,即“通用编码字符集”(Universal Coded Character Set,即UCS),及等同采用该国际尺度的中国国家尺度GB13000的设计方针,就是实现所有字符在统一字符集中等长编码、齐截使用的真正多文种信息措置。UCS划定了全世界现代书面说话文字所使用的所有字符的尺度编码。
  2.Unicode
  通用编码字符集是一个由各类巨细字符集组成的编码系统。能容纳足够多的各类字符集,四字节的编码(UCS-4)可以放置13亿个字符。
  可是,四字节的字符编码太华侈存储空间了,它也给措置和传输带来了很大未便。是以,在UCS编码空间中把00组的00平面称为根基多文种平面(Basic Multilingual Plane,BMP),并划定,当组编码、平面编码均为00H时可以省略,是以放置在根基多文种平面上的字符只需要使用两个字节来暗示,这就形成了一个双字节编码的字符集,它是UCS的子集,记做UCS-2,又称做Unicode(统一 码,或连系码)。
  3.每日韩统一汉字编码字符集(CJK编码)
  UCS(Unicode)中的表意文字部门采用的是每日韩统一汉字编码(称为CJK编码)。所谓汉字的统一编码是指,非论国家和地域,非论汉字的字义有无区别,只要字形不异,该汉字就只有一个代码。
  4.GB18030-2000编码
  GB18030-2000编码尺度在原本的GB2312-1980编码尺度和GBK编码尺度的基本长进行了扩充,增添了四字节部门的编码。它可以完全映射国际尺度ISO10646(UCS)的根基平面和所有辅助平面,共有160多万个码位。
  (四)文本
  1.简单文本(纯文本)
  最简单的文本除了可显示/打印的ASCII字符(汉字)及“回车”、“换行”、“制表”等用于名目节制的有限几个ASCII字符之外,几乎不包含任何其他信息。这种文本经常称为纯文本或ASII文本,文件的后缀名是.txt。
  2.丰硕名目文本
  为了使文本能以整洁、精明、美不美观、细腻的形式揭示给用户阅读,人们需要对纯文本进行需要的加工,这个过程称为文本的名目化,或者称为排版。经由上述措置后的文本一般称为“丰硕名目文本”(Rich Text Format)。因为属性标识表记标帜和节制呼吁并不统一,是以分歧的文本措置软件获得的丰硕名目文本互不兼容。为了便于分歧的丰硕名目文本能在分歧的软件和系统中互订交流使用,特意提出了一种中心名目,称为RTF名目,所有在PC机优势行的文字措置软件,都可以输入和输出RTF文件,从而达到了文件交流的目的。
  超文本(Hypertext)采用一种网状结构(非线性结构)来组织信息。采用这种网状结构,各信息块很轻易按照其内容的关系加以组织。它由若干文本块(或其他信息)组成,这些文本块可所以计较机的一个文件或文件的一部门,它们称为“节点”。每个节点都有若干指向其他节点或从其他节点指向该节点的指针,这些指针称为“链”。每个链毗连着两个节点,它是有向的,从一个节点(称之为源节点)指向另一个节点(称之为目的节点。链的数目与节点的内容有关,有些节点与其他节点有良多联系关系,是以它就有良多链;有些节点没有启程链,只能作为目的节点。
  节点中的数据不仅可所以文字,而且可所以图形、图像、声音、动画或动态视频,这就把超文本的节点推广到了多媒体的形式,这种基于多媒体信息节点的超文本,有时称为“超媒体”(Hyˉpermedia)。
广告合作:400-664-0084 全国热线:400-664-0084
Copyright 2010 - 2017 www.my8848.com 珠峰网 粤ICP备15066211号
珠峰网 版权所有 All Rights Reserved