版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著世界各國(guó)的各大天文臺(tái)的落成與不斷地運(yùn)行,天文數(shù)據(jù)也在以驚人的速度飛速地增長(zhǎng),對(duì)海量天文數(shù)據(jù)的處理也成為了目前天文領(lǐng)域迫切需要解決的問(wèn)題。這些海量的數(shù)據(jù)包含了測(cè)光數(shù)據(jù),光譜數(shù)據(jù)和天文圖像數(shù)據(jù)等多種數(shù)據(jù),本文主要針對(duì)天體光譜數(shù)據(jù)的預(yù)處理和自動(dòng)分類進(jìn)行研究,因?yàn)楹A康墓庾V數(shù)據(jù)中隱含著很多時(shí)變天體、稀少天體,甚至還有一些未知天體,而特殊天體的發(fā)現(xiàn)對(duì)天文領(lǐng)域的一些宇宙演變規(guī)律以及研究生命的起源等都有著特殊的意義。雖然有了這些天體的光譜數(shù)據(jù),但
2、是仍然無(wú)法確定他們的類型,僅僅靠天文觀測(cè)來(lái)發(fā)現(xiàn)新天體是非常困難的,工作量也很龐大,所以很多計(jì)算機(jī)領(lǐng)域研究者著重于研究光譜的自動(dòng)分類的方法,也有很多研究者研究挖掘特殊天體的方法。
研究發(fā)現(xiàn)很多研究人員在使用計(jì)算機(jī)的自動(dòng)分類技術(shù)來(lái)完成恒星光譜的自動(dòng)分類工作,而特殊天體的發(fā)現(xiàn)是其中一個(gè)非常重要的研究領(lǐng)域。本文主要針對(duì)斯隆數(shù)字巡天發(fā)布的相關(guān)的海量光譜數(shù)據(jù)進(jìn)行分析,重點(diǎn)研究了特殊天體的光譜數(shù)據(jù)特征,分析光譜數(shù)據(jù)的高維特征,找出適合高維光
3、譜數(shù)據(jù)的降維算法,確定其最佳維數(shù)特征;并通過(guò)算法的比較和優(yōu)化構(gòu)造不同的分類模型,最終通過(guò)實(shí)驗(yàn)對(duì)比確定最終的高準(zhǔn)確率的分類模型。目的是發(fā)現(xiàn)新的特殊天體WDMS(WhiteDwarf+M Sequence Binaries,白矮主序雙星),從而對(duì)前人已發(fā)現(xiàn)的結(jié)果進(jìn)行補(bǔ)充,為天體演化、密度分布、結(jié)構(gòu)等問(wèn)題提供了更好的條件,同時(shí)也為進(jìn)一步探究銀河系的形成與演化起到了不可或缺的作用。
本文研究了高維的天體光譜數(shù)據(jù)的有效的特征提取方法并確
4、定WDMS的最佳降維維數(shù)。分別研究了線性特征提取方法和非線性特征提取方法對(duì)高維的光譜數(shù)據(jù)進(jìn)行降維。針對(duì)線性特征提取方法主要使用了PCA(主變量分析)的方法提取光譜的主要特征值構(gòu)造光譜特征矩陣,通過(guò)主成分分析,能夠從樣本集中找到一組變換基P。針對(duì)非線性性的方法主要使用了流形學(xué)習(xí)算法:等距特征映射(Isometric Feature Mapping,ISOMAP)和深度學(xué)習(xí)的棧式自編碼(SAE)。ISOMAP采用了微分幾何中的測(cè)地線距離,而
5、非歐式距離;棧式自編碼器能夠?qū)π螺斎氲墓庾V數(shù)據(jù)進(jìn)行特征提取,利用訓(xùn)練得到的權(quán)值和光譜進(jìn)行線性組合即可得到特征光譜數(shù)據(jù)。最后對(duì)線性與非線性的特征提取方法進(jìn)行對(duì)比,從時(shí)間效率和準(zhǔn)確度上確定更適合高維光譜數(shù)據(jù)的特征提取方法,并最終與分類算法結(jié)合確定WDMS的最佳維數(shù)特征。本文的主要?jiǎng)?chuàng)新點(diǎn)有:
1.使用深度學(xué)習(xí)實(shí)現(xiàn)對(duì)低信噪比的光譜數(shù)據(jù)進(jìn)行數(shù)據(jù)降維。因?yàn)閷?duì)于高信噪比的光譜數(shù)據(jù)使用線性的特征提取方法能夠得到較高的分類準(zhǔn)確率,但是對(duì)于低信噪
6、比光譜數(shù)據(jù)分類效果不是很好,目前大多數(shù)的WDMS的研究者都主要研究信噪比高的光譜,而低信噪比的光譜由于光譜特征不夠明顯,所以研究上有一定的困難性,而本文通過(guò)實(shí)驗(yàn)證明深度學(xué)習(xí)對(duì)于低信噪比的光譜數(shù)據(jù)也有很好的特征提取的效果。
2.WDMS的分類模型構(gòu)造?;诖_定好的降維算法,構(gòu)造了不同的分類模型,并對(duì)比了不同分類模型的分類效果,最終確定了針對(duì)SDSS(斯隆數(shù)字巡天)發(fā)布的DR10的全部數(shù)據(jù)的分類模型。該模型是通過(guò)對(duì)分類算法和聚類算
7、法的分類的準(zhǔn)確率進(jìn)行對(duì)比,然后將二者進(jìn)行整合,利用聚類算法剔除大量的非WDMS,然后對(duì)剩余的光譜采用分類的方法,并對(duì)分類方法進(jìn)行優(yōu)化,提出了一個(gè)基于聚類+分類的高準(zhǔn)確率的WDMS的發(fā)現(xiàn)模型。最終通過(guò)該模型在DR10中共找出了4986個(gè)結(jié)果,其中4240個(gè)是WDMS,經(jīng)過(guò)驗(yàn)證目前沒(méi)有被發(fā)現(xiàn)的有22個(gè)。實(shí)驗(yàn)表明使用有效的數(shù)據(jù)挖掘方法進(jìn)行特殊天體的自動(dòng)搜索快速、準(zhǔn)確率高、分類效果明顯,可以將此方法應(yīng)用到其他的望遠(yuǎn)鏡數(shù)據(jù)上。
3.對(duì)已
8、發(fā)現(xiàn)的WDMS構(gòu)造顏色特征模型。Szkody提出的測(cè)光判據(jù)為相關(guān)研究提供了有效的可行性依據(jù),本論文通過(guò)構(gòu)建具有多項(xiàng)式特性的高維映射神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)網(wǎng)絡(luò),對(duì)WDMS的顏色特征進(jìn)行深度探索,擬合出分類效果更佳明顯的顏色特征模型,從而將該模型使用到SDSS發(fā)布的測(cè)光數(shù)據(jù)中,可以對(duì)海量的測(cè)光數(shù)據(jù)進(jìn)行有效的數(shù)據(jù)篩選,從而大大提高了數(shù)據(jù)挖掘的效率。同時(shí)將該模型作為前面分類模型的數(shù)據(jù)預(yù)處理模型,完成海量數(shù)據(jù)挖掘的數(shù)據(jù)篩選工作,然后使用分類模型完成
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 29919.白矮主序雙星的尋找與觀測(cè)的研究
- 海量數(shù)據(jù)庫(kù)中的小模式發(fā)現(xiàn).pdf
- 海量天文星表數(shù)據(jù)的交叉與融合.pdf
- 面向海量數(shù)據(jù)的高效天文交叉證認(rèn)的研究.pdf
- 面向海量天文數(shù)據(jù)的分布式存儲(chǔ)引擎的研究.pdf
- 海量客運(yùn)數(shù)據(jù)中的頻繁旅行模式發(fā)現(xiàn)算法研究與實(shí)現(xiàn).pdf
- 海量光譜數(shù)據(jù)降維方法的研究與應(yīng)用.pdf
- 基于healpix的海量天文數(shù)據(jù)球面可視化研究開(kāi)題報(bào)告
- 基于支持向量機(jī)的海量天體光譜數(shù)據(jù)分類系統(tǒng)研究.pdf
- 海量用戶行為序列中的模式發(fā)現(xiàn)及應(yīng)用.pdf
- 數(shù)據(jù)挖掘在保險(xiǎn)海量數(shù)據(jù)中的研究與應(yīng)用.pdf
- 基于屬性偏序結(jié)構(gòu)原理的中藥近紅外光譜知識(shí)發(fā)現(xiàn)研究.pdf
- 47094.虛擬天文臺(tái)環(huán)境下的海量數(shù)據(jù)存儲(chǔ)與訪問(wèn)技術(shù)研究
- 數(shù)據(jù)集成中的真值發(fā)現(xiàn)研究.pdf
- 海量數(shù)據(jù)存儲(chǔ)模式的研究.pdf
- MongoDB中的海量數(shù)據(jù)動(dòng)態(tài)平衡.pdf
- 海量數(shù)據(jù)組織中的索引機(jī)制研究與實(shí)現(xiàn).pdf
- 40446.太陽(yáng)鄰域下主序星的光譜定量分析
- NOSQL數(shù)據(jù)庫(kù)在海量數(shù)據(jù)存儲(chǔ)中的研究與應(yīng)用.pdf
- 基于序投影距離的微陣列數(shù)據(jù)診斷基因模式發(fā)現(xiàn)技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論