2.2 信息編碼
2.2.1 數(shù)據(jù)涵義與形態(tài)
數(shù)據(jù)(data):是人們看到的景象或聽(tīng)到的事實(shí)。
數(shù)據(jù)有兩種形態(tài):人類(lèi)可讀形式的數(shù)據(jù)和機(jī)器可讀形式的數(shù)據(jù)。
數(shù)據(jù)有數(shù)值型和非數(shù)值型兩類(lèi),這些數(shù)據(jù)在計(jì)算機(jī)中都必須以二進(jìn)制形式表示。
2.2.2 數(shù)據(jù)單位
1. 數(shù)據(jù)的常用單位有位、字節(jié)、字和字長(zhǎng)。
位(bit):是計(jì)算機(jī)中存儲(chǔ)數(shù)據(jù)的最小單位,指二進(jìn)制數(shù)中的一個(gè)位數(shù),其值為“0”或“1”,稱(chēng)為“比特”。
字節(jié)(Byte):是計(jì)算機(jī)存儲(chǔ)容量的基本單位,計(jì)算機(jī)存儲(chǔ)容量的大小是用字節(jié)的多少來(lái)衡量的。用“B”表示。單位還有KB(千字節(jié))、MB(兆字節(jié))和GB(千兆字節(jié))一個(gè)ASCII碼用1個(gè)字節(jié)表示。一個(gè)漢字占兩個(gè)字節(jié)。
字(word):指計(jì)算機(jī)一次存取、加工、運(yùn)算和傳送的數(shù)據(jù)長(zhǎng)度。一個(gè)字通常由一個(gè)或若干個(gè)字節(jié)組成。計(jì)算機(jī)字的長(zhǎng)度越長(zhǎng),則其精度和速度越高。
字長(zhǎng):一個(gè)字中所包含的二進(jìn)制位數(shù)的多少稱(chēng)為字長(zhǎng)。
2. 數(shù)據(jù)單位間的換算。
在數(shù)據(jù)單位間存在著以下?lián)Q算關(guān)系。
1B=8bit
1KB=210B=1024B
1MB=210×1KB=210×210B=1024×1024B=1024KB
1GB=210×1MB=210×210×1KB=210×210×210B=1024×1024×1024B=1024MB
2.2.3 字符編碼
1. ASCII碼
目前,國(guó)際上使用的字母、數(shù)字和符號(hào)的信息編碼系統(tǒng)是采用美國(guó)國(guó)家信息交換標(biāo)準(zhǔn)字符碼(American Standard Code for Information Interchange),簡(jiǎn)稱(chēng)為ASCII碼。它有7位碼版本和8位碼版本兩種。
國(guó)際上通用的是7位碼版本,即用7位二進(jìn)制表示一個(gè)字符,由于27=128,所以有128個(gè)字符,其中包括:0~9共10個(gè)數(shù)碼、26個(gè)小寫(xiě)字母、26個(gè)大寫(xiě)字母、34個(gè)通用控制符和32個(gè)專(zhuān)門(mén)字符。如表2-1所示。
2. 漢字的編碼
(1)漢字交換碼(國(guó)際碼)
規(guī)定了《信息交換用漢字編碼字符集-基本集》,即GB2312-80,簡(jiǎn)稱(chēng)國(guó)際碼。國(guó)際碼基本集中收錄了漢字和圖像符號(hào)共7445個(gè),分為兩級(jí)漢字。國(guó)際碼采用兩個(gè)字節(jié)表示一個(gè)漢字,每個(gè)字節(jié)只使用了低七位。這樣使得漢字與英文完全兼容。
(2)漢字機(jī)內(nèi)碼
機(jī)內(nèi)碼是計(jì)算機(jī)內(nèi)部存儲(chǔ)和加工漢字時(shí)所用的代碼。不管用何種漢字輸入碼將漢字輸入計(jì)算機(jī),為存儲(chǔ)和處理方便,都需將各種輸入碼轉(zhuǎn)換成長(zhǎng)度一致的漢字內(nèi)部碼。一般用二個(gè)字節(jié)表示一個(gè)漢字的內(nèi)碼。注:內(nèi)碼=國(guó)際碼+8080H
(3)漢字外部碼
漢字外部碼又稱(chēng)輸入碼,由鍵盤(pán)輸入漢字時(shí)主要是輸入漢字的外碼,每個(gè)漢字對(duì)應(yīng)一個(gè)外部碼。漢字輸入方法不同,同一漢字的外碼可能不同,用戶(hù)可根據(jù)自己的需要選擇不同的輸入方法。
(4)漢字字形碼
漢字字形點(diǎn)陣:漢字的字形稱(chēng)為字模,以一點(diǎn)陣表示。點(diǎn)陣中的點(diǎn)對(duì)應(yīng)存儲(chǔ)器中的一位,對(duì)于16?16點(diǎn)陣的漢字,其有256個(gè)點(diǎn),即256位。點(diǎn)陣數(shù)越大,分辨率越高,字形越美觀(guān),但占用的存儲(chǔ)空間越多。
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |