(2)浮點數(shù)(floating-point number)
計算機采用浮點數(shù)來表示數(shù)值,它與科學計算法相似,把任意一個二進制數(shù)通過移動小數(shù)點位置表示成階碼和尾數(shù)兩部分:N=2 E ×S
其中:E———N的階碼(exponent),是有符號的整數(shù);
S———N的尾數(shù)(mantissa),是數(shù)值的有效數(shù)字部分,一般規(guī)定取二進制定點純小數(shù)形式。
浮點數(shù)運算必須化成規(guī)格化形式。所謂規(guī)格化,對于原碼尾數(shù)應使最高數(shù)字位S 1 =1,如果不是1,且尾數(shù)不是全為0時就要移動尾數(shù)直到S 1 =1,階碼相應變化,保證N值不變。如果尾數(shù)是補碼,當N是正數(shù)時,S 1 必須是1,而N是負數(shù)時,S 1 必須是0,才稱為規(guī)格化的形式。
4.數(shù)字編碼
十進制數(shù)在機內(nèi)轉(zhuǎn)換成二進制數(shù)時,有時也以一種中間數(shù)字編碼形式存在,它把每一位十進制數(shù)用四位二進制編碼表達,每一組只表達0~9的數(shù)值運算時,有專門的電路在每四位二進制間按“十”進位處理,故稱為二進制編碼的十進制數(shù)———BCD碼(Binary Coded Decimal)或稱二—十進制數(shù)。其編碼種類很多,如格雷碼、余3碼等,最常用的叫8421BCD碼,4個二進制位自左向右每位的權分別是8、4、2、1。0~9的8421碼與通常的二進制一樣進位,十分簡單,當計數(shù)超過9時,需要采取辦法自動向十進制高位進一,即要進行“十進制調(diào)整”才能得到正確結(jié)果。
5.校驗碼
由于器件質(zhì)量不可靠、線路工藝不過關、遠距離傳送帶來的干擾或受來自電源、空間磁場影響等因素,使得信息在存取、傳送和計算過程中難免會發(fā)生諸如“1”誤變?yōu)椤?”的錯誤,計算機一旦出錯,要能及時檢測并糾正錯誤,其中一種方法是對數(shù)據(jù)信息擴充,加入新的代碼,它與原數(shù)據(jù)信息一起按某種規(guī)律編碼后具有發(fā)現(xiàn)錯誤的能力,有的甚至能指出錯誤所在的準確位置使機器自動糾正,能起這種作用的編碼叫“校驗碼”(check code)。
奇偶校驗碼:
將每個數(shù)據(jù)代碼擴展一個二進位作校驗位(parity bit),這個校驗取0還是取1的原則是:若是奇校驗(odd parity),編碼是含“1”的個數(shù)連同校驗位的取值在內(nèi)共有奇數(shù)個“1”;若是偶校驗(even parity),連同校驗位在內(nèi)編碼里含“1”的個數(shù)是偶數(shù)個。
交*校驗:
計算機進行大量字節(jié)傳送時一次傳送幾百甚至更多字節(jié)組成的數(shù)據(jù)塊,如果不僅每一個字節(jié)有一個奇偶校驗位———稱橫向校驗,而且全部字節(jié)的同一位也設置了一個奇偶校驗位———稱縱向校驗,對數(shù)據(jù)塊代碼的橫向縱向同時校驗,這種情況叫交*校驗。循環(huán)冗余校驗碼———CRC碼(Cyclic Redundancy Check):
計算機信息傳向遠方終端或傳到另一個計算中心時,信息沿一條通信線路一位位傳送,這種通信方式叫串行通信。循環(huán)冗余碼(簡稱CRC碼)就是一種檢驗能力很強,在串行通信中廣泛采用的校驗編碼。
(1)CRC碼
串行傳送的信息M(X)是一串k位二進制序列,在它被發(fā)送的同時,被一個事先選擇的“生成多項式”相除,“生成多項式”長r+1位,相除后得到r位余數(shù)就是校驗位,它拼接到原k位有效信息后面即形成CRC碼。CRC碼到達接收方時,接收方的設備一方面接收CRC碼,一方面用同樣的生成多項式相除,如果正好除盡,表示無信息差錯,接收方去掉CRC碼后面r位校驗位,收下k位有效信息;當不能除盡時,說明有信息的狀態(tài)位發(fā)生了轉(zhuǎn)變,即出錯了。一般要求重新傳送一次或立即糾錯。
(2)CRC碼計算
傳送信息時生成CRC碼以及接收時對CRC碼校驗都要與“生成多項式”相除,這里除法是“模2運算”,即二進位運算時不考慮進位和借位。作模2除法時,取商的原則是當部分余數(shù)首位為1時商取1,反之商取0,然后按模2減,求部分余數(shù)。這個余數(shù)不計高位。當被除數(shù)逐位除完時,最后余數(shù)的位數(shù)比除數(shù)少一位。該余數(shù)就是校驗位。它拼接在有效信息后面組成CRC碼。因為校驗位擴充了傳送部分的代碼,所以這是一種基于“冗余校驗”的思想的校驗辦法。
(3)生成多項式
CRC碼是M(X)除以某一個預先選定的多項式后產(chǎn)生的,所以這個多項式叫生成多項式。并不是任何一個r+1位的編碼都可以作生成多項式用,它應能滿足當任何一位發(fā)生傳送錯誤時都能使余數(shù)不為0,并且不同位發(fā)生錯誤時應當使余數(shù)也不同,這樣不但能檢錯而且能推斷是哪一位出錯,從而有利于準確的糾錯。有兩個生成多項式,其檢錯率很高。
X16+X15+X2+1
X16+X12+X6+1
6.非數(shù)值數(shù)據(jù)的表示方法
計算機中數(shù)據(jù)的概念是廣義的,機內(nèi)除有數(shù)值數(shù)據(jù)之外,還有文字、符號、圖象、語言和邏輯信息等等,因為它們也都是0、1形式存在,所以稱為非數(shù)值數(shù)據(jù)。
(1)字符數(shù)據(jù)
字符數(shù)據(jù)主要指數(shù)字、字母、通用符號、控制符號等,在機內(nèi)它們都被變換成計算機能夠識別的二進制編碼形式。國際上普遍采用的一種編碼是美國國家信息交換標準代碼(American Standard Code for Information Interchange),簡稱ASCII碼。ASCII碼選擇了四類共128種常用的字符:①數(shù)字0~9。②字母。
③通用符號。④動作控制符。
(2)邏輯數(shù)據(jù)
邏輯數(shù)據(jù)是指計算機不帶符號位的一位二進制數(shù)。
邏輯數(shù)據(jù)在計算機中雖然也是“0”或“1”的形式,但是與數(shù)值有很大區(qū)別:
①邏輯數(shù)據(jù)的取值只有“0”和“1”兩個值,不可能再有其他值,而數(shù)值數(shù)據(jù)0與1的不同組合可以反映很多不同數(shù)值。
②邏輯數(shù)據(jù)的“0”和“1”代表兩種成對出現(xiàn)的邏輯概念,與一般數(shù)學中代表“0”和“1”的數(shù)值概念截然不同。
③邏輯數(shù)據(jù)和邏輯數(shù)據(jù)運算可以表達事物內(nèi)部的邏輯關系,而數(shù)值數(shù)據(jù)表達的是事物的數(shù)量關系。
漢字:
(1)漢字字音編碼
(2)漢字字形編碼
(3)漢字音形編碼
(4)電報碼
(5)整字編碼
為了能在不同的漢字系統(tǒng)之間交換信息、高效率高質(zhì)量共享漢字信息,近年來國家推出了一系列有關中文信息處理的標準。比如1981年我國制定推行的GB2312-80國家標準信息交換用漢字編碼字符集(基本集)———簡稱國標碼,以及若干輔助集。國標碼收集、制定的基本圖形字符有7千余個,其中常用漢字3755個,次常用漢字3008個,共6763個漢字,還有俄文字母、日語假名、拉丁字母、希臘字母、漢語拼音,每字節(jié)內(nèi)占用7bit信息,最高位補0,例如漢字“啊”的國際碼,前一字節(jié)是01100000,后一字節(jié)是00100001,編碼為3021H。
漢字內(nèi)部碼是漢字在計算機內(nèi)部存儲、運算的信息代碼,內(nèi)部碼的設計要求與西文信息處理有較好的兼容性,當一個漢字以某種漢字輸入方案送入計算機后,管理模塊立刻將它轉(zhuǎn)換成兩字節(jié)長的GB2312-80國標碼,如果給國標碼的每字節(jié)最高位加“1”,作為漢字標識符,就成為一種機器內(nèi)部表示漢字的代碼———漢字內(nèi)部碼。漢字內(nèi)部碼的特點十分明顯:
①漢字內(nèi)部碼結(jié)構(gòu)簡短。一個漢字內(nèi)部碼只占兩個字節(jié),兩字節(jié)足以表達數(shù)千個漢字和各種符號圖形,且又節(jié)省計算機存儲空間。
②便于和西文字符兼容。西文字符的ASCII碼占一個字節(jié),兩字節(jié)的漢字內(nèi)碼可以看成是它擴展的字符代碼,在同一個計算機系統(tǒng)中,只要從最高位標識符就能區(qū)分這兩種代碼。標識符是“0”,即是ASCII碼;標識符是“1”,則是漢字內(nèi)部碼。
7.語音識別及語言表示原理
語音產(chǎn)生機理的研究表明,每一種語言的語音都有自己特定的音素特征,語音是不同頻率振動的結(jié)果。分析語音的音素特點,找出音素的基頻和高次頻率優(yōu)分,就能在計算機中建立發(fā)音系統(tǒng)的模型,在實施中對語音采樣,通過濾波器分解提取頻率信息,由模/數(shù)轉(zhuǎn)換設備轉(zhuǎn)換成數(shù)字輸入計算機,與機內(nèi)的語言模型比較,由此達到識別語音的目的。與此相反,如果選擇已知音素的參數(shù),應用語音系統(tǒng)模型,就能得到指定的音素,進一步按照一定的規(guī)則合成語言。
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |