高考考生志愿數(shù)據(jù)分析與挖掘研究.pdf_第1頁
已閱讀1頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、如何填報高考志愿,增加考生被自己心儀院校錄取的幾率,是每一位高考考生和家長密切關(guān)注的問題。目前國內(nèi)雖然有相應(yīng)的志愿填報輔助參考系統(tǒng),然而只是單純的依據(jù)考生成績或位次進(jìn)行簡單的比較分析,無法從根本上為考生的志愿填報提供有價值的參考信息。鑒于此,本文以某省招生自考辦公室招生數(shù)據(jù)挖掘項(xiàng)目為依托,以該省自實(shí)行網(wǎng)絡(luò)招生以來所積累的近9年海量電子招生數(shù)據(jù)(其中包含了大量有關(guān)考生基礎(chǔ)數(shù)據(jù)、志愿填報數(shù)據(jù)、高校專業(yè)設(shè)置與院校錄取結(jié)果等有用信息)為基礎(chǔ),首

2、先建立招考數(shù)據(jù)倉庫,然后根據(jù)志愿主題建立多維數(shù)據(jù)集,接著利用OLAP技術(shù)從多角度、多側(cè)面、多層次對考生志愿數(shù)據(jù)進(jìn)行分析,最后利用數(shù)據(jù)挖掘技術(shù)對考生志愿數(shù)據(jù)進(jìn)行挖掘,得到一些可資借鑒的結(jié)果。本文的工作主要包含以下四個方面:
   ⑴完成了歷史招生數(shù)據(jù)的數(shù)據(jù)清洗。本文首先對該省近9年的歷史招生數(shù)據(jù)進(jìn)行了比較分析,從而發(fā)現(xiàn)存在著數(shù)據(jù)質(zhì)量與集成方面的問題;然后對電子招生數(shù)據(jù)代碼表進(jìn)行規(guī)范化處理,依據(jù)該省招考人員的建議建立高考招生數(shù)據(jù)代碼

3、規(guī)范。最后依據(jù)代碼規(guī)范利用SSIS(Microsoft SQL Server2008 Integration Services)對歷史招生數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、轉(zhuǎn)換,將數(shù)據(jù)裝載至招考數(shù)據(jù)倉庫。
   ⑵建立了招考數(shù)據(jù)倉庫。本文所涉及的是重慶市科技攻關(guān)計劃項(xiàng)目“重慶市招生數(shù)據(jù)挖掘與系統(tǒng)開發(fā)”的一部分,該課題系實(shí)際應(yīng)用性項(xiàng)目,因此需要對項(xiàng)目的需求進(jìn)行科學(xué)、合理分析。根據(jù)用戶需求分析劃分相應(yīng)主題,確定事實(shí)度量與數(shù)據(jù)粒度,設(shè)計招考數(shù)據(jù)倉庫模

4、型,最后將清洗后的數(shù)據(jù)裝載至招考數(shù)據(jù)倉庫。
   ⑶對高考考生志愿數(shù)據(jù)進(jìn)行了多維分析研究。本文依據(jù)志愿分析主題設(shè)計多維數(shù)據(jù)集模型,從招考數(shù)據(jù)倉庫中抽取相關(guān)數(shù)據(jù),建立志愿數(shù)據(jù)立方體,采用OLAP技術(shù)從院校/專業(yè)報考熱度與專業(yè)最低錄取分兩個方面對志愿數(shù)據(jù)進(jìn)行多角度分析,得到一些廣大考生可資借鑒的結(jié)果。
   ⑷對高考考生志愿數(shù)據(jù)進(jìn)行了挖掘研究。本文以考生志愿填報信息為基礎(chǔ),結(jié)合高考錄取結(jié)果,依據(jù)CRISP-DM(Cross-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論