二、 計(jì)算視數(shù)據(jù)管理
數(shù)據(jù)處理的中心問題是數(shù)據(jù)管理。計(jì)算機(jī)對(duì)數(shù)據(jù)的管理是指如何對(duì)數(shù)據(jù)分類、組織、編碼、存儲(chǔ),檢索和難護(hù)。
計(jì)算機(jī)在數(shù)據(jù)管理方面經(jīng)歷了由低級(jí)到高級(jí)的發(fā)展過程。計(jì)算機(jī)數(shù)據(jù)管理隨著計(jì)算機(jī)硬件、軟件技術(shù)和計(jì)算機(jī)應(yīng)用范圍的發(fā)展而發(fā)展,先后經(jīng)歷了人工管理、文件系統(tǒng)和數(shù)據(jù)庫系統(tǒng)、分布式數(shù)據(jù)庫系統(tǒng)和面向?qū)ο髷?shù)據(jù)庫系統(tǒng)等幾個(gè)階段。
1.人工管理
20世紀(jì)50年代中期以前,計(jì)算機(jī)主要用于科學(xué)計(jì)算。當(dāng)時(shí)的硬件狀況是,外存儲(chǔ)器只有紙帶、卡片、磁帶,沒有像磁盤這樣的可以隨機(jī)訪問、直接存取的外部存儲(chǔ)設(shè)備。軟件狀況是,沒有操作系統(tǒng),沒有專門管理數(shù)據(jù)的軟件,數(shù)據(jù)由計(jì)算或處理它的程序自行攜帶。數(shù)據(jù)管理任務(wù),包括存儲(chǔ)結(jié)構(gòu)、存取方法、輸入/輸出方式等完全由程序設(shè)計(jì)人員自行負(fù)責(zé)。
這一時(shí)期計(jì)算機(jī)數(shù)據(jù)管理的特點(diǎn)是:數(shù)據(jù)與程序不具有獨(dú)立性,一組數(shù)據(jù)對(duì)應(yīng)一組程序。數(shù)據(jù)不能長期保存,程序運(yùn)行結(jié)束后就退出計(jì)算機(jī)系統(tǒng),一個(gè)程序中的數(shù)據(jù)無法被其它程序使用, 因此程序與程序之間存在大量的重復(fù)數(shù)據(jù),稱為數(shù)據(jù)冗余。
2.文件系統(tǒng)
20世紀(jì)50年代后期到60年代中期,計(jì)算機(jī)的應(yīng)用范圍逐漸擴(kuò)大,計(jì)算機(jī)不僅用于科學(xué)計(jì)算,而且還大量用于管理。這時(shí)可以直接存取的磁鼓、磁盤成為聯(lián)機(jī)的主要外部存儲(chǔ)設(shè)備;在軟件方面,出現(xiàn)了高級(jí)語言和操作系統(tǒng)。操作系統(tǒng)中已經(jīng)有了專門的數(shù)據(jù)管理軟件,稱為文件系統(tǒng)。
在文件系統(tǒng)階段,程序和數(shù)據(jù)有了一定的獨(dú)立性,程序和數(shù)據(jù)分開存儲(chǔ),有了程序文件和數(shù)據(jù)文件的區(qū)別。數(shù)據(jù)文件可以長期保存在外存儲(chǔ)器上被多次存取。
在文件系統(tǒng)的支持下,程序只需用文件名就可以訪問數(shù)據(jù)文件,程序員可以將精力集中在數(shù)據(jù)處理的算法上,面不必關(guān)心記錄在存儲(chǔ)器上的地址和內(nèi)、外存交換數(shù)據(jù)的過程。
但是,文件系統(tǒng)中的數(shù)據(jù)文件是為了滿足特定業(yè)務(wù)領(lǐng)域,或某部門的專門需要而設(shè)計(jì)的,服務(wù)于某一特定應(yīng)用程序,數(shù)據(jù)和程序相互依賴。同一數(shù)據(jù)項(xiàng)可能重復(fù)出現(xiàn)在多個(gè)文件中,導(dǎo)致數(shù)據(jù)冗余度大,這不僅浪費(fèi)了存儲(chǔ)空間,增加了更新開銷,更嚴(yán)重的是,由于不能統(tǒng)一修改,容易造成數(shù)據(jù)的不—致。
文件系統(tǒng)存在的問題阻礙了數(shù)據(jù)處理技術(shù)的發(fā)展,不能滿足日益增長的信息需求,這正是數(shù)據(jù)庫技術(shù)產(chǎn)生的原動(dòng)力,也是數(shù)據(jù)庫系統(tǒng)產(chǎn)生的背景。
3.數(shù)據(jù)庫系統(tǒng)
從20世紀(jì)60年代后期以來,計(jì)算機(jī)用于管理的規(guī)模更為龐大,應(yīng)用越來越廣泛,需要計(jì)算機(jī)管理的數(shù)據(jù)量急劇增長,同時(shí)多種應(yīng)用、多種語言互相覆蓋地共享數(shù)據(jù)集合的要求越來越強(qiáng)烈。這時(shí)硬件有大容量磁盤,硬件價(jià)格下降;軟件價(jià)格上升,為編制和維護(hù)系統(tǒng)軟件及應(yīng)用程序所需的成本相對(duì)增加。在處理方式上,聯(lián)機(jī)實(shí)時(shí)處理要求更多,并開始提出和考慮分布處理。在這種背景下,以文件系統(tǒng)作為數(shù)據(jù)管理手段已經(jīng)不能滿足應(yīng)用的需求,于是為解決多用戶、多應(yīng)用共享數(shù)據(jù)的需求,使數(shù)據(jù)為盡可能多的應(yīng)用提供服務(wù),出現(xiàn)了數(shù)據(jù)庫技術(shù)和統(tǒng)一管理數(shù)據(jù)的專門軟件系統(tǒng)一一數(shù)據(jù)庫管理系統(tǒng)。
1968年美國IBM公司研制成功的數(shù)據(jù)庫管理系統(tǒng)IMS(Information Management System)標(biāo)志著數(shù)據(jù)處理技術(shù)進(jìn)人了數(shù)據(jù)庫系統(tǒng)階段。IMS是層次模型數(shù)據(jù)庫。1969年美國CODASYL(Conference on Data System Language,數(shù)據(jù)系統(tǒng)語言協(xié)會(huì))委員會(huì)公布了DBTG報(bào)告,對(duì)研制開發(fā)網(wǎng)狀數(shù)據(jù)庫系統(tǒng)起到了推動(dòng)作用。自1970年起,IBM公司的E.F.Godd連續(xù)發(fā)表論文,奠定了關(guān)系數(shù)據(jù)庫的理論基礎(chǔ)。目前關(guān)系數(shù)據(jù)庫系統(tǒng)巳逐漸淘汰了網(wǎng)狀數(shù)據(jù)庫和層次數(shù)據(jù)庫,成為當(dāng)今最流行的商用數(shù)據(jù)庫系統(tǒng)。
數(shù)據(jù)庫技術(shù)的主要目的是有效地管理和存取大量的數(shù)據(jù)資源,包括:提商數(shù)據(jù)的共享性,使多個(gè)用戶能夠同時(shí)訪問數(shù)據(jù)庫中的數(shù)據(jù);減小數(shù)據(jù)的冗余,以提高數(shù)據(jù)的一致性和完整性;提供數(shù)據(jù)與應(yīng)用程序的獨(dú)立性,從而減少應(yīng)用程序的開發(fā)和維護(hù)代價(jià)。
為數(shù)據(jù)庫的建立、使用和維護(hù)而配置的軟件稱為數(shù)據(jù)庫管理系統(tǒng)(Data Base Management System,DBMS)。數(shù)據(jù)庫管理系統(tǒng)以操作系統(tǒng)提供的輸入/輸出控制和文件訪問功能為基礎(chǔ),因此它需要在操作系統(tǒng)的支持下才能運(yùn)行。
相關(guān)推薦:2011年上半年計(jì)算機(jī)等級(jí)考試報(bào)名時(shí)間匯總
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |