

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、隨著云計算環(huán)境中數(shù)據(jù)量的激增,人們急需研究在云環(huán)境下如何對大量數(shù)據(jù)進行快速有效的分析與處理。在云環(huán)境下對大量數(shù)據(jù)進行高效地排序是其中一個重要問題。一些被廣泛使用的排序算法是否能在云計算系統(tǒng)中高性能運行,運行時所需要消耗的云計算資源量都是令人非常關注的問題。本文主要進行Hadoop平臺上快速,高效,集群負載均衡度高,資源消耗少的排序算法的研究,主要工作為:
1)分析研究串行系統(tǒng)中效率較高的排序算法。在熟練掌握MapReduce編
2、程框架和Hadoop體系結(jié)構(gòu)的基礎上,對Radixsort,Quicksort以及Samplesort在Hadoop平臺上進行實現(xiàn)。分別對Radixsort,Quicksort和Samplesort的算法思想及在串行和并行系統(tǒng)中的復雜度問題進行比較分析。
2)對基于Hadoop平臺的Radixsort,Quicksort和Samplesort的執(zhí)行效率、CPU資源的消耗,內(nèi)存的消耗,以及處理機間的通信量進行研究和比較分析。通過
3、大量運行在Hadoop上的實驗,發(fā)現(xiàn)Hadoop平臺上的Samplesort相較于Radixsort和Quicksort具有排序速度快,負載均衡度高,CPU消耗低等優(yōu)勢。這一結(jié)果為云計算環(huán)境下設計更高效、節(jié)能的算法提供了有效的依據(jù)和基礎。
3)針對不均勻數(shù)據(jù)集的高效排序問題,研究并提出了一種排序效率高,負載均衡度高的隨機化分區(qū)Samplesort算法。Samplesort是一種在云計算環(huán)境中大量使用的排序算法。在數(shù)據(jù)可以均勻分
4、割的情況下,samplesort算法把數(shù)據(jù)分割成為多個數(shù)據(jù)塊,高速并行地對數(shù)據(jù)塊進行排序。Samplesort在處理一些密度均勻的數(shù)據(jù)集時具有較高效率,而現(xiàn)實生活中的數(shù)據(jù)集往往分布極不均勻。為了解決密度分布不均勻數(shù)據(jù)集的排序問題,提出了一種隨機化分區(qū)的樣本排序算法,RandomizedPartitionSampleSort(RPSS)。它引入了一個隨機化分區(qū)函數(shù),能夠使得密度不均勻數(shù)據(jù)相對均勻的分布。通過大量運行在Hadoop集群上的實
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于云環(huán)境下排序的模糊關鍵字搜索.pdf
- 云計算環(huán)境下關聯(lián)規(guī)則算法的研究.pdf
- 云計算環(huán)境下任務調(diào)度算法的研究.pdf
- 云計算環(huán)境中任務調(diào)度算法研究.pdf
- 云計算環(huán)境下的計算模型性能優(yōu)化研究.pdf
- 多排序者下排序集抽樣的均值估計.pdf
- 云計算環(huán)境下的并行SVM算法研究.pdf
- 云計算環(huán)境下的資源調(diào)度算法研究.pdf
- 云計算環(huán)境下資源分配算法的研究.pdf
- 云計算環(huán)境下的模式挖掘算法研究.pdf
- 云計算環(huán)境下任務調(diào)度算法研究.pdf
- 基于云計算環(huán)境的web數(shù)據(jù)挖掘算法研究.pdf
- P2P環(huán)境下排序查詢處理和分類技術的研究.pdf
- 云計算環(huán)境下動態(tài)負載均衡算法的研究.pdf
- 云計算環(huán)境下的入侵檢測算法研究.pdf
- 基于云計算環(huán)境下資源調(diào)度算法研究.pdf
- 云計算環(huán)境下密碼算法模型的研究與實現(xiàn).pdf
- 云計算環(huán)境下協(xié)同過濾推薦算法研究.pdf
- 云計算環(huán)境下基于資源預測的任務調(diào)度算法研究.pdf
- 移動云計算環(huán)境下移動設備的能量優(yōu)化算法研究.pdf
評論
0/150
提交評論