基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的決策支持系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第1頁(yè)
已閱讀1頁(yè),還剩40頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章第一章引言引言11問(wèn)題的提出問(wèn)題的提出我國(guó)的電信業(yè),尤其是移動(dòng)通信業(yè),起步比較晚,但發(fā)展非常快,對(duì)許多業(yè)務(wù)的決策和方向的把握都是在摸索中進(jìn)行的,某些立項(xiàng)缺乏統(tǒng)一意見(jiàn)和充足的科學(xué)依據(jù),帶有一定程度的盲目性。另一方面,經(jīng)過(guò)多年運(yùn)營(yíng),積累了龐大的業(yè)務(wù)數(shù)據(jù),如計(jì)費(fèi)中心的計(jì)費(fèi)數(shù)據(jù)、客服中心的用戶信息數(shù)據(jù)等,這些海量數(shù)據(jù)中包含著寶貴的經(jīng)驗(yàn)和商業(yè)信息,可以很好地拿來(lái)借鑒今后的業(yè)務(wù)運(yùn)作。但是這些數(shù)據(jù)信息隱藏在龐大、復(fù)雜的數(shù)據(jù)庫(kù)里面,許多有價(jià)值的信

2、息并沒(méi)有直接表現(xiàn)出來(lái),而是掩蓋在無(wú)聊的數(shù)據(jù)后面。多數(shù)情況下,我們不得不用到某些分析工具,以期取得豐富而又客觀翔實(shí)的商業(yè)信息,用于開(kāi)發(fā)更大的市場(chǎng)和提供更完善的服務(wù)。到目前為止,電信業(yè)尚無(wú)比較完備的分析工具,然而另一方面,電信業(yè)又面臨著許多急于解決的問(wèn)題,如:話費(fèi)流失問(wèn)題、新業(yè)務(wù)開(kāi)展問(wèn)題、基站分配問(wèn)題、批價(jià)問(wèn)題等等。以話費(fèi)流失為例,我國(guó)電信業(yè)每年僅此項(xiàng)損失就達(dá)數(shù)億元人民幣之巨,基本上無(wú)法追回。如何盡快避免或盡量減免這一損失,就顯得極為迫切和

3、必須。在這種背景下,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)以及其上的一些分析挖掘工具就應(yīng)運(yùn)而生了,如聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘等等。決策支持系統(tǒng)(DSSDecisionSupptSystem)是70年代由美國(guó)M.S.ScottMton提出,迅速發(fā)展起來(lái)的新型學(xué)科。決策支持系統(tǒng)是綜合利用大量數(shù)據(jù),有機(jī)組合眾多模型(數(shù)學(xué)模型與數(shù)據(jù)處理模型等),通過(guò)人機(jī)交互,輔助各級(jí)決策者實(shí)現(xiàn)科學(xué)決策的系統(tǒng)。數(shù)據(jù)倉(cāng)庫(kù)DW(DataWarehouse)建立在傳統(tǒng)事務(wù)型數(shù)據(jù)庫(kù)的基礎(chǔ)之上,為企

4、業(yè)DSS及數(shù)據(jù)挖掘系統(tǒng)提供數(shù)據(jù)源。它從原事務(wù)數(shù)據(jù)庫(kù)中將分析型數(shù)據(jù)與事務(wù)型數(shù)據(jù)相分離,單獨(dú)存放而形成數(shù)據(jù)集合。數(shù)據(jù)倉(cāng)庫(kù)就是要把分散存放在企業(yè)各個(gè)地方的數(shù)據(jù)集中到一起,并利用這些數(shù)據(jù)制定出更好的決策。聯(lián)機(jī)分析處理OLAP(OnLineAnalysisProcessing)是數(shù)據(jù)倉(cāng)庫(kù)上的分析應(yīng)用工具。它建立在多維數(shù)據(jù)視圖的基礎(chǔ)上,主要有在線性和多維分析兩個(gè)特點(diǎn)。數(shù)據(jù)挖掘DM(DataMining)是從大量數(shù)據(jù)中提取出可信的、新穎的、有效的并能

5、被人理解的模式的高級(jí)處理過(guò)程。412國(guó)內(nèi)外發(fā)展現(xiàn)狀國(guó)內(nèi)外發(fā)展現(xiàn)狀目前,各大數(shù)據(jù)庫(kù)廠商均在數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目上提出了風(fēng)格各異、內(nèi)容相似的數(shù)據(jù)倉(cāng)庫(kù)全面解決方案,比較知名的有acle、Sybase、Infmix、IBM、NCR、CA等公司。Sybase擁有一個(gè)獨(dú)特而強(qiáng)有力的點(diǎn)對(duì)點(diǎn)方案,用來(lái)設(shè)計(jì)、建立和管理數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市。各個(gè)部門(mén)之間通過(guò)集中的元數(shù)據(jù)進(jìn)行交互,具有完整性、集中性和靈活性等特點(diǎn)。使用的工具也具有很多優(yōu)越性能,如PowerDesign

6、er上分別聚類,然后進(jìn)行二次(或多次)聚類,在很大程度上提高了算法的正確度。6第二章第二章數(shù)據(jù)倉(cāng)庫(kù)技術(shù)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)21基本概念基本概念隨著IT業(yè)的發(fā)展,業(yè)界數(shù)據(jù)規(guī)模的不斷擴(kuò)大。為了以合理的費(fèi)用,向任何地點(diǎn)需要數(shù)據(jù)的人提供高質(zhì)量的數(shù)據(jù),1992年WilliamH.Inmon提出了取得廣泛認(rèn)可的數(shù)據(jù)倉(cāng)庫(kù)概念:集成的、面向主題的、隨時(shí)間變化的不可修改的數(shù)據(jù)集合。從上面的定義,我們可以知道,數(shù)據(jù)倉(cāng)庫(kù)首先是一個(gè)數(shù)據(jù)的集合,在這一點(diǎn)上,它與傳統(tǒng)意義

7、上的數(shù)據(jù)庫(kù)是一致的。實(shí)際在物理上,數(shù)據(jù)倉(cāng)庫(kù)也主要是以關(guān)系表的形式實(shí)現(xiàn)的。數(shù)據(jù)倉(cāng)庫(kù)有四大主要特點(diǎn):面向主題的。是相對(duì)于傳統(tǒng)數(shù)據(jù)庫(kù)的面向應(yīng)用而言的。所謂面向應(yīng)用,指的是系統(tǒng)實(shí)現(xiàn)過(guò)程中主要圍繞著一些應(yīng)用或功能。而面向主題則考慮一個(gè)個(gè)的問(wèn)題域,對(duì)問(wèn)題域涉及到的數(shù)據(jù)和分析數(shù)據(jù)所采用的功能給予同樣的重視。集成的。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)來(lái)自各個(gè)不同的數(shù)據(jù)源(操作數(shù)據(jù)庫(kù)),由于歷史的原因,各操作數(shù)據(jù)庫(kù)的組織結(jié)構(gòu)往往是不同的,在這些異構(gòu)數(shù)據(jù)載入到數(shù)據(jù)倉(cāng)庫(kù)之前,

8、必須經(jīng)歷一個(gè)集成過(guò)程,或稱為抽取過(guò)程。隨時(shí)間變化的。數(shù)據(jù)倉(cāng)庫(kù)以維的形式對(duì)數(shù)據(jù)進(jìn)行組織,維是數(shù)據(jù)倉(cāng)庫(kù)技術(shù)中很重要的一個(gè)概念。通常可以這樣理解一個(gè)維:維是人們看待事物的一種角度。維具有層次性。不可修改的。與面向應(yīng)用的事務(wù)數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)作頻繁的插入、更新操作不同的是,對(duì)于數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的操作僅限于數(shù)據(jù)的初始導(dǎo)入和記錄查詢。在數(shù)據(jù)載入數(shù)據(jù)倉(cāng)庫(kù)之后,一般不允許隨意修改。22數(shù)據(jù)倉(cāng)庫(kù)簡(jiǎn)介數(shù)據(jù)倉(cāng)庫(kù)簡(jiǎn)介數(shù)據(jù)倉(cāng)庫(kù)是一種結(jié)構(gòu)化的數(shù)據(jù)環(huán)境,為決策支持系統(tǒng)提供數(shù)

9、據(jù)源。它可以幫助企業(yè)管理者準(zhǔn)確了解企業(yè)的狀況,從而進(jìn)行預(yù)測(cè),制定計(jì)劃并作出明智的決策。數(shù)據(jù)倉(cāng)庫(kù)作為整個(gè)企業(yè)的業(yè)務(wù)數(shù)據(jù)集成庫(kù),從眾多數(shù)據(jù)源中集成數(shù)據(jù),它包含龐大的企業(yè)級(jí)數(shù)據(jù),其實(shí)質(zhì)是由多種技術(shù)和服務(wù)組成的完整的解決方案。數(shù)據(jù)倉(cāng)庫(kù)處理的數(shù)據(jù)與一般的信息系統(tǒng)的數(shù)據(jù)不同,它來(lái)自不同的分散數(shù)據(jù)源,包括操作數(shù)據(jù)、歷史數(shù)據(jù)、外部數(shù)據(jù)等,對(duì)這些數(shù)據(jù)進(jìn)行提煉和綜合,集成到一個(gè)單一的關(guān)系數(shù)據(jù)倉(cāng)庫(kù)中;對(duì)這個(gè)集成的數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行管理,將其規(guī)范為面7向主題的格式,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論