首頁 考試吧論壇 Exam8視線 考試商城 網(wǎng)絡(luò)課程 模擬考試 考友錄 實(shí)用文檔 繽紛校園 英語學(xué)習(xí) | ||
2010考研 | 自學(xué)考試 | 成人高考 | 專 升 本 | 法律碩士 | MBA/MPA | 中 科 院 | ||
四六級 | 商務(wù)英語 | 公共英語 | 職稱日語 | 職稱英語 | 博思 | 口譯筆譯 | GRE GMAT | 日語 | 托福 | ||
雅思 | 專四專八 | 新概念 | 自考英語 | 零起點(diǎn)英、法、德、日、韓語 | 在職申碩英語 | ||
在職攻碩英語 | 成人英語三級 | ||
等級考試 | 水平考試 | 微軟認(rèn)證 | 思科認(rèn)證 | Oracle認(rèn)證 | Linux認(rèn)證 | ||
公務(wù)員 | 報(bào)關(guān)員 | 報(bào)檢員 | 外銷員 | 司法考試 | 導(dǎo)游考試 | 教師資格 | 國際商務(wù)師 | 跟單員 | ||
單證員 | 物流師 | 價(jià)格鑒證師 | 銀行從業(yè)資格 | 證券從業(yè)資格 | 人力資源管理師 | 管理咨詢師 | ||
期貨從業(yè)資格 | 社會工作者 | ||
會計(jì)職稱 | 注會CPA | 經(jīng)濟(jì)師 | 統(tǒng)計(jì)師 | 注冊稅務(wù)師 | 評估師 | 精算師 | 高會 | ACCA | 審計(jì)師 | ||
法律顧問 | 會計(jì)證 | ||
一級建造師 | 二級建造師 | 造價(jià)師 | 監(jiān)理師 | 安全師 | 咨詢師 | 結(jié)構(gòu)師 | 建筑師 | 安全評價(jià)師 | ||
房地產(chǎn)估價(jià)師 | 土地估價(jià)師 | 設(shè)備監(jiān)理師 | 巖土工程師 | 質(zhì)量資格 | 房地產(chǎn)經(jīng)紀(jì)人 | 造價(jià)員 | ||
投資項(xiàng)目管理 | 土地代理人 | 環(huán)保師 | 環(huán)境影響評價(jià) | 物業(yè)管理師 | 城市規(guī)劃師 | 公路監(jiān)理師 | ||
公路造價(jià)工程師 | 招標(biāo)師 | ||
執(zhí)業(yè)護(hù)士 | 執(zhí)業(yè)醫(yī)師 | 執(zhí)業(yè)藥師 | 衛(wèi)生資格 |
關(guān)鍵詞:數(shù)據(jù)倉庫(DW),操作數(shù)據(jù)存儲(ODS),即時(shí)聯(lián)機(jī)分析處理(OLAP)
1.問題提出
面向主題的數(shù)據(jù)倉庫(DW)概念的提出,不但為有效地支持企業(yè)經(jīng)營管理決策提供了一個(gè)全局一致的數(shù)據(jù)環(huán)境,也為歷史數(shù)據(jù),綜合數(shù)據(jù)的處理提出了一種行之有效的解決方法。數(shù)據(jù)倉庫概念的提出也清楚的把數(shù)據(jù)處理劃分為了操作型處理和分析型處理兩種不同類型,從而建立起了DB-DW的兩層體系結(jié)構(gòu)。但是有很多情況,DB-DW的兩層體系結(jié)構(gòu)并不能涵蓋企業(yè)所有的數(shù)據(jù)處理要求,因?yàn)槠髽I(yè)的數(shù)據(jù)處理雖然可以較為粗略的劃分成操作型和分析型兩部分,但這兩種類型也不是涇渭分明的,它們之間也有交叉的情況,譬如,有些是操作型的,但不適合在操作型DB中進(jìn)行,而又有一些是分析型處理,但不適合在DW中進(jìn)行。
比如我們開發(fā)的一個(gè)醫(yī)藥銷售公司的決策系統(tǒng),按要求公司經(jīng)理要解決什么商品該進(jìn)貨了,各種商品近來的贏利情況,客戶的信任情況等等。要回答這些問題,他必須首先要弄清楚藥品的存貨是否充裕,還要了解該藥品近期的銷售情況,另外還要和別的藥品的庫存和銷售情況進(jìn)行比較等。如果我們把這個(gè)決策分析過程放在原有的面向應(yīng)用的分散DB系統(tǒng)中去完成的話,不一定得到每個(gè)部門的準(zhǔn)確一致的信息,而要進(jìn)行各部門間的協(xié)調(diào)配合,工作量勢必會很大,但如果把其放在DW中去進(jìn)行分析的話,不但費(fèi)時(shí),而且會有很多的不必要的數(shù)據(jù)檢索存在。
對于上述問題可以借助于DB-DW的中間層ODS(操作數(shù)據(jù)存儲)來解決。它象DW一樣是一種面向主題,集成的數(shù)據(jù)環(huán)境,又象操作型DB一樣包含著全局一致的,細(xì)節(jié)的當(dāng)前的數(shù)據(jù)。建立基于ODS的即時(shí)OLAP應(yīng)用是應(yīng)中層決策分析之需要的一種解決方案,它能很好的適應(yīng)企業(yè)日常頻繁的中低層次的決策分析應(yīng)用。
2.ODS技術(shù)和即時(shí)OLAP
是用于支持企業(yè)日常的全局應(yīng)用的數(shù)據(jù)集合,ODS的數(shù)據(jù)具有面向主題、集成的、可變的和數(shù)據(jù)是當(dāng)前的或是接近當(dāng)前的4個(gè)基本特征。ODS是介于DB和DW之間的一種數(shù)據(jù)存儲技術(shù),和原來面向應(yīng)用的分散的DB相比,ODS中的數(shù)據(jù)組織方式和數(shù)據(jù)倉庫(DW)一樣也是面向主題的和集成的,所以對進(jìn)入ODS的數(shù)據(jù)也象進(jìn)入數(shù)據(jù)倉庫的數(shù)據(jù)一樣進(jìn)行轉(zhuǎn)化和集成處理。另外ODS只是存放當(dāng)前或接近當(dāng)前的數(shù)據(jù),如果需要的話還可以對ODS中的數(shù)據(jù)進(jìn)行增、刪和更新等操作,雖然DW中的數(shù)據(jù)也是面向主題和集成的,但這些數(shù)據(jù)一般不進(jìn)行修改,所以O(shè)DS和DW的區(qū)別主要體現(xiàn)數(shù)據(jù)的可變性和當(dāng)前性上。
ODS主要是適應(yīng)企業(yè)級的全局應(yīng)用的需要而產(chǎn)生的,對它的應(yīng)用主要是在即時(shí)"OLAP"的數(shù)據(jù)處理上。
我們在DW上實(shí)現(xiàn)OLAP主要是為了進(jìn)行長期趨勢分析,DW中是數(shù)據(jù)量很大,所以O(shè)LAP應(yīng)用的運(yùn)行時(shí)間都比較長。在企業(yè)日常經(jīng)營中,常常要進(jìn)行一些非戰(zhàn)略的中層決策以實(shí)現(xiàn)企業(yè)的日常管理和控制,譬如,醫(yī)藥銷售公司經(jīng)理要每周查看藥品的銷售情況,各地區(qū)的藥品銷售情況,業(yè)務(wù)員的業(yè)績情況等等,并且這種決策過程并不需要參考太多的歷史數(shù)據(jù),主要是參考當(dāng)前的或比較當(dāng)前的數(shù)據(jù),還需要比較快的執(zhí)行速度,可以把這種分析決策稱為"即時(shí)OLAP"。顯然利用DW不但運(yùn)行的效率是無法讓人忍受而且也很難準(zhǔn)確的反映近期的真實(shí)情況,ODS的建立克服了DW系統(tǒng)過于臃腫,處理時(shí)間過長和不適應(yīng)即時(shí)OLAP的情況,提供給中層決策者以快捷準(zhǔn)確的分析信息。
在DB-ODS的體系結(jié)構(gòu)中,ODS的實(shí)現(xiàn)機(jī)制表現(xiàn)在其記錄系統(tǒng)定義的數(shù)據(jù)傳送關(guān)系上,如圖1所示。操作型環(huán)境中各分散的DB記錄經(jīng)過過濾后形成了ODS系統(tǒng)的記錄系統(tǒng),向ODS系統(tǒng)中提供數(shù)據(jù)。記錄系統(tǒng)定義了原有分散DB中那些數(shù)據(jù)送往ODS,并指明與ODS數(shù)據(jù)相應(yīng)的數(shù)據(jù)表。通過ODS的定義可以把分散于應(yīng)用的DB中的數(shù)據(jù)復(fù)制到ODS中去,這樣原來的分散DB中的記錄就形成了ODS中的面向主題的記錄。ODS維護(hù)著一個(gè)分析型的環(huán)境,數(shù)據(jù)處理簡單得多,實(shí)際需要的支持技術(shù)也很少。
圖1 從DB向ODS轉(zhuǎn)化機(jī)制
上圖沒有給出從ODS向DB轉(zhuǎn)化的實(shí)現(xiàn)機(jī)制,這種情況主要用在有關(guān)企業(yè)全局操作應(yīng)用的情況,可以通過在ODS系統(tǒng)中存放一些參數(shù)表,它所反應(yīng)的關(guān)系是ODS全局更新時(shí)必須要反應(yīng)到所有DB中的相關(guān)記錄。此時(shí),ODS是一個(gè)操作型環(huán)境,實(shí)現(xiàn)ODS所要求的技術(shù)跟原來的面向應(yīng)用的分散的數(shù)據(jù)庫系統(tǒng)一樣,包括事務(wù)管理、封鎖管理、數(shù)據(jù)恢復(fù)等等技術(shù)。
3 基于ODS的藥品銷售即時(shí)OLAP應(yīng)用的設(shè)計(jì)
我們知道ODS是介于DB和DW之間的一種新的數(shù)據(jù)存儲技術(shù),它兼有DW和DB的特點(diǎn),在開發(fā)即時(shí)OLAP系統(tǒng)時(shí),其開發(fā)方式更接近DW的開發(fā)模式。
該藥品銷售公司原本的一個(gè)銷售數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫結(jié)構(gòu)如圖2所示,是分布在
圖2 源數(shù)據(jù)庫ER模型
ACCESS97數(shù)據(jù)庫中,分屬于財(cái)務(wù),銷售和庫存等幾個(gè)數(shù)據(jù)庫中。
根據(jù)前面的分析,優(yōu)先選擇銷售區(qū)域,客戶和藥品三個(gè)在銷售領(lǐng)域最關(guān)切的的主題,把事務(wù)數(shù)據(jù)庫中涉及到此領(lǐng)域的數(shù)據(jù)轉(zhuǎn)入到ODS中。ODS(主要對照DW)邏輯模型的類別主要有星形模型,雪花模型和混合模型等三種,我們在開發(fā)ODS邏輯模型時(shí)用了星形模型。一個(gè)簡單的星形模型由一個(gè)事實(shí)表和若干個(gè)維表組成,而復(fù)雜的的星形模型可能包括數(shù)百個(gè)維表。星形模型從支持商務(wù)決策的角度定義了數(shù)據(jù)實(shí)體,它能客觀在實(shí)體中反映商務(wù)運(yùn)行的規(guī)則和屬性,與后兩種模型相比,設(shè)計(jì)相對簡單,更容易被用戶所理解和接受,圖3是本系統(tǒng)的邏輯模型。
圖3 ODS的星形模型
定義記錄系統(tǒng)時(shí),主要考慮如何將主題域的各個(gè)屬性分配到應(yīng)用系統(tǒng)中去,這里主要考慮把各主題中的屬性分配到藥品銷售的操作環(huán)境中的銷售和庫存等子系統(tǒng)中。
數(shù)據(jù)采集過程跨越分散DB操作環(huán)境和ODS分析環(huán)境。本系統(tǒng)中數(shù)據(jù)采集過程較為簡單,只需要按照ODS記錄系統(tǒng)和ODS記錄系統(tǒng)定義兩者之間的映射關(guān)系,將DB中的數(shù)據(jù)傳送到ODS,這里我們采用了SQL SERVER 7.0的DTS數(shù)據(jù)轉(zhuǎn)換服務(wù),SQL SERVER 7.0的DTS(Data Transformation Services)提供了數(shù)據(jù)的提取,轉(zhuǎn)換和裝載的功能。利用SQL SERVER 7。0的輸入輸出向?qū)?chuàng)建DTS包,在復(fù)制時(shí)使用SNAPSHOT(快照類型)對ODS中的數(shù)據(jù)進(jìn)行清除和重建,由于數(shù)據(jù)量不是很大,故可以取得很好的執(zhí)行效率。