4.1 數據庫系統(tǒng)的基本概念
數據:實際上就是描述事物的符號記錄。
數據的特點:有一定的結構,有型與值之分,如整型、實型、字符型等。而數據的值給出了符合定型的值,如整型值15。
數據庫:是數據的集合,具有統(tǒng)一的結構形式并存放于統(tǒng)一的存儲介質內,是多種應用數據的集成,并可被各個應用程序共享。
數據庫存放數據是按數據所提供的數據模式存放的,具有集成與共享的特點。
數據庫管理系統(tǒng):一種系統(tǒng)軟件,負責數據庫中的數據組織、數據操縱、數據維護、控制及保護和數據服務等,是數據庫的核心。
數據庫管理系統(tǒng)功能:
(1)數據模式定義:即為數據庫構建其數據框架;
(2)數據存取的物理構建:為數據模式的物理存取與構建提供有效的存取方法與手段;
(3)數據操縱:為用戶使用數據庫的數據提供方便,如查詢、插入、修改、刪除等以及簡單的算術運算及統(tǒng)計;
(4)數據的完整性、安生性定義與檢查;
(5)數據庫的并發(fā)控制與故障恢復;
(6)數據的服務:如拷貝、轉存、重組、性能監(jiān)測、分析等。
為完成以上六個功能,數據庫管理系統(tǒng)提供以下的數據語言:
(1)數據定義語言:負責數據的模式定義與數據的物理存取構建;
(2)數據操縱語言:負責數據的操縱,如查詢與增、刪、改等;
(3)數據控制語言:負責數據完整性、安全性的定義與檢查以及并發(fā)控制、故障恢復等。
數據語言按其使用方式具有兩種結構形式:交互式命令(又稱自含型或自主型語言)宿主型語言(一般可嵌入某些宿主語言中)。
數據庫管理員:對數據庫進行規(guī)劃、設計、維護、監(jiān)視等的專業(yè)管理人員。
數據庫系統(tǒng):由數據庫(數據)、數據庫管理系統(tǒng)(軟件)、數據庫管理員(人員)、硬件平臺(硬件)、軟件平臺(軟件)五個部分構成的運行實體。
數據庫應用系統(tǒng):由數據庫系統(tǒng)、應用軟件及應用界面三者組成。
文件系統(tǒng)階段:提供了簡單的數據共享與數據管理能力,但是它無法提供完整的、統(tǒng)一的、管理和數據共享的能力。
層次數據庫與網狀數據庫系統(tǒng)階段 :為統(tǒng)一與共享數據提供了有力支撐。
關系數據庫系統(tǒng)階段
數據庫系統(tǒng)的基本特點:數據的集成性 、數據的高共享性與低冗余性 、數據獨立性(物理獨立性與邏輯獨立性)、數據統(tǒng)一管理與控制。
數據庫系統(tǒng)的三級模式:
(1)概念模式:數據庫系統(tǒng)中全局數據邏輯結構的描述,全體用戶公共數據視圖;
(2)外模式:也稱子模式與用戶模式。是用戶的數據視圖,也就是用戶所見到的數據模式;
(3)內模式:又稱物理模式,它給出了數據庫物理存儲結構與物理存取方法。
數據庫系統(tǒng)的兩級映射:
(1)概念模式到內模式的映射;
(2)外模式到概念模式的映射。
4.2 數據模型
數據模型的概念:是數據特征的抽象,從抽象層次上描述了系統(tǒng)的靜態(tài)特征、動態(tài)行為和約束條件,為數據庫系統(tǒng)的信息表與操作提供一個抽象的框架。描述了數據結構、數據操作及數據約束。
E-R模型的基本概念
(1)實體:現實世界中的事物;
(2)屬性:事物的特性;
(3)聯系:現實世界中事物間的關系。實體集的關系有一對一、一對多、多對多的聯系。
E-R模型三個基本概念之間的聯接關系:實體是概念世界中的基本單位,屬性有屬性域,每個實體可取屬性域內的值。一個實體的所有屬性值叫元組。
E-R模型的圖示法:(1)實體集表示法; (2)屬性表法; (3)聯系表示法。
層次模型的基本結構是樹形結構,具有以下特點:
(1)每棵樹有且僅有一個無雙親結點,稱為根;
(2)樹中除根外所有結點有且僅有一個雙親。
從圖論上看,網狀模型是一個不加任何條件限制的無向圖。
關系模型采用二維表來表示,簡稱表,由表框架及表的元組組成。一個二維表就是一個關系。
在二維表中凡能唯一標識元組的最小屬性稱為鍵或碼。從所有侯選健中選取一個作為用戶使用的鍵稱主鍵。表A中的某屬性是某表B的鍵,則稱該屬性集為A的外鍵或外碼。
關系中的數據約束:
(1)實體完整性約束:約束關系的主鍵中屬性值不能為空值;
(2)參照完全性約束:是關系之間的基本約束;
(3)用戶定義的完整性約束:它反映了具體應用中數據的語義要求。
4.3關系代數
關系數據庫系統(tǒng)的特點之一是它建立在數據理論的基礎之上,有很多數據理論可以表示關系模型的數據操作,其中最為著名的是關系代數與關系演算。
關系模型的基本運算:
(1)插入 (2)刪除 (3)修改 (4)查詢(包括投影、選擇、笛卡爾積運算)
4.4 數據庫設計與管理
數據庫設計是數據應用的核心。
數據庫設計的兩種方法:
(1)面向數據:以信息需求為主,兼顧處理需求;
(2)面向過程:以處理需求為主,兼顧信息需求。
數據庫的生命周期:需求分析階段、概念設計階段、邏輯設計階段、物理設計階段、編碼階段、測試階段、運行階段、進一步修改階段。
需求分析常用結構析方法和面向對象的方法。結構化分析(簡稱SA)方法用自頂向下、逐層分解的方式分析系統(tǒng)。用數據流圖表達數據和處理過程的關系。對數據庫設計來講,數據字典是進行詳細的數據收集和數據分析所獲得的主要結果。
數據字典是各類數據描述的集合,包括5個部分:數據項、數據結構、數據流(可以是數據項,也可以是數據結構)、數據存儲、處理過程。
數據庫概念設計的目的是分析數據內在語義關系。設計的方法有兩種
(1)集中式模式設計法(適用于小型或并不復雜的單位或部門);
(2)視圖集成設計法。
設計方法:E-R模型與視圖集成。
視圖設計一般有三種設計次序:自頂向下、由底向上、由內向外。
視圖集成的幾種沖突:命名沖突、概念沖突、域沖突、約束沖突。
關系視圖設計:關系視圖的設計又稱外模式設計。
關系視圖的主要作用:
(1)提供數據邏輯獨立性;
(2)能適應用戶對數據的不同需求;
(3)有一定數據保密功能。
數據庫的物理設計主要目標是對數據內部物理結構作調整并選擇合理的存取路徑,以提高數據庫訪問速度有效利用存儲空間。一般RDBMS中留給用戶參與物理設計的內容大致有索引設計、集成簇設計和分區(qū)設計。
數據庫管理的內容:
(1)數據庫的建立;
(2)數據庫的調整;
(3)數據庫的重組;
(4)數據庫安全性與完整性控制;
(5)數據庫的故障恢復;
(6)數據庫監(jiān)控。
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內蒙古 |