-
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 46
大?。?1.19(MB)
子文件數(shù):
-
簡(jiǎn)介:在漢語(yǔ)中,句子由連續(xù)的漢字組成,中文分詞完成句子從有字的序列轉(zhuǎn)化為詞的序列的任務(wù)。傳統(tǒng)的機(jī)械分詞方法基于人工維護(hù)的辭典,需要大量的維護(hù)成本。本文提出一種基于統(tǒng)計(jì)學(xué)習(xí)的分詞方法,以期在最小人工干預(yù)的條件下達(dá)到盡可能高的分詞性能。本文首先對(duì)中文分詞技術(shù)做了概述。指出了當(dāng)前中文分詞領(lǐng)域中存在的一些難點(diǎn)問(wèn)題,并對(duì)常見(jiàn)的分詞理論和技術(shù)進(jìn)行了回顧,為論文的研究奠定了理論基礎(chǔ)。第三章詳細(xì)描述了本文提出的基于統(tǒng)計(jì)學(xué)習(xí)的分詞方法。該方法在傳統(tǒng)的統(tǒng)計(jì)方法基礎(chǔ)上做了亮點(diǎn)改進(jìn)1、引入了基于對(duì)數(shù)似然比的漢字間關(guān)聯(lián)度描述,并與逐點(diǎn)互信息和信息熵相結(jié)合,提出了一種混合漢字間關(guān)聯(lián)度度量方法2、將常用的二元語(yǔ)法擴(kuò)展為三元語(yǔ)法,提出了一種性能優(yōu)化的三元語(yǔ)法獲取和使用方法。根據(jù)不同自然語(yǔ)言處理應(yīng)用對(duì)分詞的需求并不相同這一基本事實(shí),本文第四章中提出了一種面向應(yīng)用的分詞架構(gòu),將基于統(tǒng)計(jì)學(xué)習(xí)的分詞方法用于未登錄詞識(shí)別和分詞粒度調(diào)整。面向應(yīng)用的分詞方法有效彌補(bǔ)了未登錄詞造成的損失,還可以根據(jù)不同應(yīng)用的需求,切分出不同粒度的分詞結(jié)果。最后對(duì)系統(tǒng)進(jìn)行了實(shí)驗(yàn)及結(jié)果分析。最后對(duì)本文的工作做了分析總結(jié),分析了系統(tǒng)的優(yōu)勢(shì)和不足,提出了下一步工作的方向。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-10
頁(yè)數(shù): 66
大?。?3.11(MB)
子文件數(shù):
-
簡(jiǎn)介:生物醫(yī)學(xué)文本信息抽取是生物醫(yī)學(xué)研究中不可缺少的環(huán)節(jié),有關(guān)生物醫(yī)學(xué)的最新信息大部分以文獻(xiàn)的形式存在,隨著統(tǒng)計(jì)學(xué)習(xí)技術(shù)和自然語(yǔ)言處理技術(shù)的發(fā)展,采用歸納統(tǒng)計(jì)的方法從文本中發(fā)現(xiàn)知識(shí)已經(jīng)成為可能。因此采用信息抽取技術(shù)從生物醫(yī)學(xué)文獻(xiàn)發(fā)現(xiàn)生物醫(yī)學(xué)知識(shí)是急需和有效的方法。近年來(lái)生物醫(yī)學(xué)文本信息抽取已經(jīng)取得了一定的成果,但是與新聞?lì)I(lǐng)域同類(lèi)工作相比,平均性能相差近20個(gè)百分點(diǎn)。生物醫(yī)學(xué)領(lǐng)域的文本信息抽取任務(wù)很富有挑戰(zhàn)性,主要是由生物醫(yī)學(xué)領(lǐng)域文本的特點(diǎn)決定的。目前現(xiàn)有成果距離真正實(shí)用還有一定距離,其中最主要的問(wèn)題就是識(shí)別的精確率和召回率還有待提高,尚不能滿(mǎn)足實(shí)用化的要求。本文以提高生物醫(yī)學(xué)文本信息抽取的性能作為目標(biāo),尋求新的識(shí)別策略,為推進(jìn)生物醫(yī)學(xué)文本信息抽取的實(shí)用化做出貢獻(xiàn)。本文研究從如下幾個(gè)方面展開(kāi)1研究了基于單分類(lèi)器的生物醫(yī)學(xué)命名實(shí)體識(shí)別方法。該方法針對(duì)生物醫(yī)學(xué)命名實(shí)體特點(diǎn)選擇了豐富有效的特征集合,包括局部特征、全文特征和外部資源特征,提高了學(xué)習(xí)模型的學(xué)習(xí)性能。為了進(jìn)一步提高系統(tǒng)的性能,本文還引入了縮寫(xiě)詞識(shí)別、嵌套識(shí)別、邊界擴(kuò)展和過(guò)濾器等后處理過(guò)程,從多方面結(jié)合多個(gè)策略來(lái)提高生物醫(yī)學(xué)命名實(shí)體的識(shí)別性能。2提出了基于元學(xué)習(xí)策略的多分類(lèi)器融合模型,包括同態(tài)元學(xué)習(xí)模型和異態(tài)元學(xué)習(xí)模型識(shí)別生物醫(yī)學(xué)命名實(shí)體。同態(tài)元學(xué)習(xí)模型采用了BAGSTACKING模型并提出了將基分類(lèi)器輸出的分類(lèi)的置信度作為元分類(lèi)器的輸入的一項(xiàng)特征來(lái)提高系統(tǒng)的性能。異態(tài)元學(xué)習(xí)模型使用兩種元學(xué)習(xí)策略包括疊加歸納法和級(jí)聯(lián)歸納法融合了四種不同的學(xué)習(xí)模型。實(shí)驗(yàn)結(jié)果表明該模型能夠充分利用不同分類(lèi)器識(shí)別能力之間的互補(bǔ)性和相關(guān)性以及多個(gè)層次的特征來(lái)提高整體識(shí)別性能。同時(shí),打破了單一學(xué)習(xí)模型不能覆蓋生物醫(yī)學(xué)命名實(shí)體的所有特點(diǎn),只能借助豐富的特征選擇和有效的后處理過(guò)程來(lái)提高系統(tǒng)性能的局限性,取得了比單分類(lèi)器更好的識(shí)別結(jié)果。3提出了基于多AGENT系統(tǒng)學(xué)習(xí)的生物醫(yī)學(xué)命名實(shí)體識(shí)別方法。探索了將多AGENT系統(tǒng)學(xué)習(xí)方法引入到生物醫(yī)學(xué)命名實(shí)體識(shí)別中,以提高生物醫(yī)學(xué)命名實(shí)體的識(shí)別性能,包括基于多AGENT元學(xué)習(xí)框架和基于決策共現(xiàn)矩陣的多AGENT融合策略,實(shí)驗(yàn)結(jié)果證明多AGENT系統(tǒng)學(xué)習(xí)是一種有效的生物醫(yī)學(xué)命名實(shí)體的識(shí)別方法,其中面向生物醫(yī)學(xué)命名實(shí)體識(shí)別的多AGENT元學(xué)習(xí)框架解決了語(yǔ)料分配不平衡的問(wèn)題,提高了小類(lèi)別和難識(shí)別類(lèi)別的性能。4研究了基于元學(xué)習(xí)策略的分類(lèi)器融合方法在蛋白質(zhì)相互作用關(guān)系識(shí)別中的應(yīng)用。該研究的主要目的是通過(guò)分析蛋白質(zhì)相互作用關(guān)系的特點(diǎn),選擇有效的特征集合,包括淺層語(yǔ)言學(xué)特征和深層句法特征,并選擇合適的學(xué)習(xí)模型來(lái)提高蛋白質(zhì)相互作用關(guān)系識(shí)別的性能;并在此基礎(chǔ)上提出了基于元學(xué)習(xí)策略的分類(lèi)器融合方法,將基于淺層語(yǔ)言學(xué)特征模型和基于深層句法特征模型融合在一起,充分利用了基于不同特征模型學(xué)習(xí)結(jié)果之間的互補(bǔ)性和相關(guān)性,進(jìn)一步提高了蛋白質(zhì)相互作用關(guān)系識(shí)別的性能。本文主要貢獻(xiàn)在于將多種統(tǒng)計(jì)學(xué)習(xí)方法應(yīng)用于生物醫(yī)學(xué)信息抽取領(lǐng)域,對(duì)該領(lǐng)域中命名實(shí)體識(shí)別任務(wù)作了深入探索。提出了結(jié)合豐富領(lǐng)域特征、融合多個(gè)后處理模塊的基于統(tǒng)計(jì)學(xué)習(xí)的生物醫(yī)學(xué)命名實(shí)體識(shí)別方法;將基于元學(xué)習(xí)的多分類(lèi)器融合策略引入生物醫(yī)學(xué)命名實(shí)體識(shí)別研究;將多AGENT系統(tǒng)學(xué)習(xí)引入到生物醫(yī)學(xué)命名實(shí)體識(shí)別研究;提出了一種融合生物醫(yī)學(xué)文本淺層語(yǔ)言學(xué)特征和深層句法特征的蛋白質(zhì)相互作用關(guān)系識(shí)別方法??傮w來(lái)說(shuō),本文在應(yīng)用統(tǒng)計(jì)學(xué)習(xí)方法進(jìn)行生物醫(yī)學(xué)文本信息抽取方法作了廣泛深入的探索,取得了較好的結(jié)果。這些研究對(duì)于文本信息處理領(lǐng)域的同類(lèi)研究具有參考價(jià)值。同時(shí),將有助于醫(yī)學(xué)研究人員對(duì)生命的探索、疑難病理的研究、有效藥物的開(kāi)發(fā)等。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 149
大?。?1.11(MB)
子文件數(shù):
-
簡(jiǎn)介:隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展和人民生活水平的提高,住宅建筑節(jié)能已成為可持續(xù)發(fā)展的必然要求。如何通過(guò)科學(xué)的統(tǒng)計(jì)方法,全面分析住宅建筑能耗特征及其影響因素,并科學(xué)評(píng)價(jià)各城市住宅能耗現(xiàn)狀及相關(guān)因素對(duì)其的作用,對(duì)了解住宅建筑能源消耗的本質(zhì)特點(diǎn)、科學(xué)管理其發(fā)展變化、以及合理引導(dǎo)各城市住宅建筑節(jié)能有著重要意義。因此,本文根據(jù)統(tǒng)計(jì)學(xué)的相關(guān)理論,建立了住宅建筑能耗統(tǒng)計(jì)調(diào)查方法,根據(jù)該方法對(duì)五大建筑氣候區(qū)劃下典型城市的住宅建筑能耗進(jìn)行了調(diào)查;并根據(jù)調(diào)查數(shù)據(jù),對(duì)各城市住宅建筑能耗特征和影響因素進(jìn)行了較為深入的統(tǒng)計(jì)分析;建立了住宅住宅建筑能量信息系統(tǒng)評(píng)價(jià)模型對(duì)各城市進(jìn)行了評(píng)價(jià)。文章首先定義了“住宅建筑能量信息系統(tǒng)”,該定義從住戶(hù)能耗量、住宅建筑概況、住戶(hù)基本資料、住戶(hù)能耗設(shè)備信息、運(yùn)行狀態(tài)信息、以及建筑物外部條件等六個(gè)方面,全面反映了住宅建筑能耗特征和復(fù)雜的影響因素,以及各因素和能耗量之間的關(guān)系。根據(jù)“住宅建筑能量信息系統(tǒng)”的定義,結(jié)合我國(guó)五大建筑氣候區(qū)劃下的住宅建筑能耗、社會(huì)、技術(shù)等各自特點(diǎn),提出了全國(guó)住宅建筑能耗統(tǒng)計(jì)調(diào)查方法。該方法包括調(diào)查指標(biāo)、調(diào)查表格以及調(diào)查組織方式。調(diào)查指標(biāo)全面反映了不同建筑氣候區(qū)劃下住戶(hù)能耗設(shè)備及能耗結(jié)構(gòu)的特點(diǎn),并將各指標(biāo)科學(xué)地設(shè)計(jì)在調(diào)查表格之中。調(diào)查組織方式的確定有利于實(shí)際調(diào)查的開(kāi)展。按照上述統(tǒng)計(jì)調(diào)查方法,對(duì)嚴(yán)寒地區(qū)的哈爾濱、烏魯木齊,寒冷地區(qū)的西安、北京,夏熱冬冷地區(qū)的上海、長(zhǎng)沙、重慶,溫暖地區(qū)的昆明以及夏熱冬暖地區(qū)的香港等城市進(jìn)行了冬夏兩季住宅建筑能耗調(diào)查。文章分析了各城市調(diào)查住戶(hù)的建筑概況、住戶(hù)基本資料、能耗設(shè)備信息及運(yùn)行狀況等特征,以及冬夏兩季各城市住戶(hù)能耗量,并對(duì)各城市住宅建筑總體的冬夏兩季戶(hù)均能耗量進(jìn)行了區(qū)間估計(jì)。此外,選取了長(zhǎng)沙和邵陽(yáng)兩城市進(jìn)行了住宅建筑全年能耗調(diào)查及能耗特征分析,并利用分項(xiàng)能耗估算法對(duì)全年采暖空調(diào)、炊事熱水等分項(xiàng)能耗值進(jìn)行了估算。在實(shí)測(cè)調(diào)查的基礎(chǔ)上,利用數(shù)量化理論I,從“住宅建筑能量信息系統(tǒng)”的建筑物內(nèi)部因素即建筑概況、住宅基本資料、住戶(hù)能耗設(shè)備基本信息、運(yùn)行狀態(tài)信息等四方面,找出了各城市住宅建筑冬夏兩季能耗影響因素以及長(zhǎng)沙、邵陽(yáng)兩城市住宅建筑全年能耗影響因素,討論了各城市住宅建筑節(jié)能的有效途徑。數(shù)量化理論I的應(yīng)用,不僅可以分析各定量、定性的影響因素,還可以分析各定性因素中不同類(lèi)目的各自影響程度,從而克服了傳統(tǒng)多元統(tǒng)計(jì)分析方法的不足。對(duì)各城市影響因素的分析發(fā)現(xiàn),建筑概況、采暖空調(diào)設(shè)備及熱水器的使用、住戶(hù)人口、年收入、氣候等因素都能影響住宅建筑能耗。氣候相似的各城市的影響因素具有某些共性,但不同城市又有其自身特點(diǎn),如影響因素有所差別,各因素的影響程度也不相同等。因此,必須根據(jù)該城市的實(shí)際分析結(jié)果,采取相應(yīng)節(jié)能措施。為深入分析不同能耗量大小的各住戶(hù)能耗特點(diǎn),文章進(jìn)一步從住宅建筑能源消費(fèi)的“基本單位”住戶(hù)的角度出發(fā),利用對(duì)應(yīng)分析的方法,對(duì)各氣候區(qū)劃下的城市住戶(hù)按能耗量大小進(jìn)行了聚類(lèi)評(píng)價(jià),找出了導(dǎo)致不同能耗量等級(jí)的對(duì)應(yīng)原因,并為同一城市不同能耗量等級(jí)的住戶(hù)節(jié)能提出合理化建議。綜合評(píng)價(jià)住宅能量系統(tǒng)的優(yōu)劣需考慮多方面的因素。文章最后從住戶(hù)能耗量、建筑室內(nèi)熱環(huán)境、建筑內(nèi)部其他因素、建筑外部條件、生態(tài)環(huán)境效益和社會(huì)經(jīng)濟(jì)效益等六個(gè)方面系統(tǒng)的確定了城市住宅建筑能量信息系統(tǒng)的評(píng)價(jià)指標(biāo),根據(jù)數(shù)量化理論Ⅲ建立了城市住宅建筑能量信息系統(tǒng)綜合評(píng)價(jià)的數(shù)學(xué)模型,并對(duì)五大建筑氣候區(qū)劃下各城市住宅建筑能量信息系統(tǒng)進(jìn)行了綜合評(píng)價(jià)。數(shù)量化理論Ⅲ的優(yōu)點(diǎn)在于,利用定性因素進(jìn)行評(píng)價(jià)時(shí),能根據(jù)實(shí)際情況,用0和1標(biāo)記反應(yīng)值,運(yùn)用多元分析的原理和方法通過(guò)計(jì)算將定性數(shù)據(jù)量化,從而不需要專(zhuān)家主觀打分來(lái)量化定性數(shù)據(jù),克服了評(píng)分法或指數(shù)法的不足。本文的主要?jiǎng)?chuàng)新點(diǎn)在于1提出了住宅建筑能耗指標(biāo)體系,從住戶(hù)能耗量、住宅建筑概況、住戶(hù)基本資料、住戶(hù)能耗設(shè)備信息、運(yùn)行狀態(tài)信息、以及建筑物外部條件等六個(gè)方面全面定義了住宅建筑能耗特征以及影響因素;2在住宅建筑能耗指標(biāo)的基礎(chǔ)上,建立了我國(guó)住宅建筑能耗統(tǒng)計(jì)調(diào)查方法。實(shí)施該方法能全面反映不同建筑氣候區(qū)劃下住戶(hù)能耗設(shè)備及能耗結(jié)構(gòu)的特點(diǎn)。3對(duì)五大建筑氣候區(qū)劃下的各典型城市住宅建筑能耗進(jìn)行了統(tǒng)一調(diào)查。該調(diào)查內(nèi)容全面,調(diào)查組織形式科學(xué);各城市的調(diào)查方法和指標(biāo)統(tǒng)一,便于各城市之間的對(duì)比;反映了我國(guó)五大建筑氣候區(qū)劃下城市住宅建筑能耗的各自特點(diǎn)。4將能耗統(tǒng)計(jì)調(diào)查方法的設(shè)計(jì)、統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)分析、節(jié)能評(píng)價(jià)四個(gè)連續(xù)的環(huán)節(jié)作為一個(gè)完整的研究體系,而將統(tǒng)計(jì)學(xué)理論作為貫穿每個(gè)環(huán)節(jié)的理論基礎(chǔ)。課題研究按照該研究思想展開(kāi),從而使得整個(gè)住宅建筑能耗研究工作有了理論指導(dǎo)。其中,利用數(shù)量化理論,找出了五大建筑氣候區(qū)劃下各城市住宅建能耗的影響因素;通過(guò)對(duì)應(yīng)分析,在同一張主因子平面點(diǎn)聚圖中將各能耗量等級(jí)的住戶(hù)與該能耗量等級(jí)的影響因子進(jìn)行了“可視化對(duì)應(yīng)”。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-11
頁(yè)數(shù): 178
大?。?12.11(MB)
子文件數(shù):
-
簡(jiǎn)介:隨著社會(huì)和科技的發(fā)展,模式識(shí)別和計(jì)算機(jī)視覺(jué)在當(dāng)前社會(huì)中的應(yīng)用越來(lái)越廣泛,尤其是自美國(guó)911事件后,個(gè)人身份確認(rèn)不僅僅使用于銀行金融、電子商務(wù)、公司考勤和家庭安全等領(lǐng)域,更多地提升到了一個(gè)國(guó)家的安全角度。在當(dāng)前,應(yīng)用于身份確認(rèn)的生物特征主要有指紋、虹膜,人臉,掌紋等。人臉作為一種生物特征,由于其具有直觀簡(jiǎn)單、信息量大和采集方便等優(yōu)點(diǎn),越來(lái)越多的引起了廣大研究者的關(guān)注。在當(dāng)前,基于人臉生物特征的應(yīng)用領(lǐng)域包括自動(dòng)人臉識(shí)別、視頻監(jiān)控、人臉表情分析、視頻會(huì)議和人機(jī)交互系統(tǒng)等,而在上述應(yīng)用中,首先要解決的一個(gè)問(wèn)題就是人臉檢測(cè),其檢測(cè)效果直接影響到整個(gè)系統(tǒng)的性能。近幾年來(lái),正是由于人臉檢測(cè)在現(xiàn)實(shí)應(yīng)用中的廣泛性,已經(jīng)引起了越來(lái)越多的科研工作者的注意,已經(jīng)發(fā)展成為了一個(gè)獨(dú)立的研究方向。隨著人們對(duì)人臉檢測(cè)的不斷深入研究,出現(xiàn)了多種實(shí)用的人臉檢測(cè)算法。在本文中,我們針對(duì)現(xiàn)有算法各自?xún)?yōu)缺點(diǎn),結(jié)合考慮到現(xiàn)實(shí)中彩色圖像普及的事實(shí),實(shí)現(xiàn)了膚色分割和基于統(tǒng)計(jì)學(xué)的分類(lèi)器相結(jié)合的人臉檢測(cè)技術(shù)。首先通過(guò)膚色分割技術(shù)將可能的人臉區(qū)域從圖像中分割出來(lái),形成人臉候選區(qū)域,然后使用基于統(tǒng)計(jì)學(xué)的分類(lèi)器對(duì)所有的侯選區(qū)域進(jìn)行確認(rèn),通過(guò)驗(yàn)證的區(qū)域?yàn)槿四?,從而?shí)現(xiàn)了人臉檢測(cè)。具體的內(nèi)容包括1、對(duì)現(xiàn)有的膚色分割技術(shù)做了詳細(xì)的介紹,并且對(duì)常用的膚色模型在不同的膚色空間下的分割性能做了詳細(xì)的比較,通過(guò)對(duì)高斯膚色模型和簡(jiǎn)單膚色模型各自的優(yōu)缺點(diǎn)比較,提出了結(jié)合兩者進(jìn)行分割的模型,從而兼顧了效率和精度。2、實(shí)現(xiàn)了當(dāng)前人臉檢測(cè)中應(yīng)用最廣泛的兩種方法支持向量機(jī)SVM和ADABOOST算法,并將其和膚色分割算法相結(jié)合來(lái)實(shí)現(xiàn)彩色人臉檢測(cè)。對(duì)SVM使用不同的特征像素特征和PCA特征情況下的分類(lèi)能力做了比較。3、提出了一種新的基于統(tǒng)計(jì)學(xué)中的分類(lèi)器最小最大概率機(jī)和最小錯(cuò)誤最小最大概率機(jī)的人臉檢測(cè)算法,通過(guò)結(jié)合膚色分割技術(shù)實(shí)現(xiàn)了對(duì)彩色人臉的檢測(cè)。同樣地類(lèi)似于SVM對(duì)其在不同的特征情況下的分類(lèi)能力做了比較。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-10
頁(yè)數(shù): 82
大小: 16.6(MB)
子文件數(shù):
-
簡(jiǎn)介:本文的工作是基于統(tǒng)計(jì)學(xué)習(xí)理論的虹膜識(shí)別研究。虹膜識(shí)別屬于生物識(shí)別技術(shù)的一種,是一項(xiàng)根據(jù)人眼睛中瞳孔之外鞏膜之內(nèi)的一個(gè)圓環(huán)內(nèi)部復(fù)雜的紋理特征來(lái)鑒別身份的技術(shù)。我們?cè)谠敿?xì)研究統(tǒng)計(jì)學(xué)習(xí)理論的最新進(jìn)展和虹膜識(shí)別的主要特點(diǎn)的基礎(chǔ)上,圍繞虹膜特征提取、虹膜特征融合約減、分類(lèi)器設(shè)計(jì)、虹膜識(shí)別系統(tǒng)原型設(shè)計(jì)等四個(gè)方面進(jìn)行了較為深入的研究。本文對(duì)現(xiàn)行的虹膜識(shí)別已有方法進(jìn)行了綜述,指出了現(xiàn)有虹膜識(shí)別研究的不足之處。并在此基礎(chǔ)上做出了以下貢獻(xiàn)第一項(xiàng)工作是在虹膜特征提取方面,提出并實(shí)現(xiàn)了基于分形幾何的自相似特征提取;并針對(duì)虹膜紋理分布的特殊性,研究了這種紋理變化的細(xì)節(jié)特征,發(fā)現(xiàn)了它的自相似性,提出了一種新的分形維數(shù)變化分?jǐn)?shù)維,并給出了它的計(jì)算方法。變化分?jǐn)?shù)維是在傳統(tǒng)分形幾何的基礎(chǔ)上,針對(duì)圖像內(nèi)部的豐富變化細(xì)節(jié)具有一定的自相似性而提出的,對(duì)瞳孔和眼睫毛的影響具有較好的抗干擾能力。實(shí)驗(yàn)結(jié)果表明該特征比傳統(tǒng)的分形維數(shù)能夠更好地表征虹膜的紋理特征。除了虹膜識(shí)別之外,變化分?jǐn)?shù)維也適用于其它的圖像分析場(chǎng)合;第二項(xiàng)工作是提出了虹膜特征融合約減機(jī)制。過(guò)去的虹膜識(shí)別方法一般都只有一種特征,主要是小波變換和GAB變換。而虹膜這么復(fù)雜的識(shí)別對(duì)象在有些情況下不能被一種特征值準(zhǔn)確刻畫(huà)。為了獲取虹膜圖像紋理分布的方向性信息,引入了多尺度可變方向金字塔模型作為虹膜紋理方向性特征的分析工具,對(duì)各個(gè)方向進(jìn)行濾波,分別求出每個(gè)子帶的特征,作為變化分?jǐn)?shù)維的補(bǔ)充,從而得到虹膜的融合特征。為了獲得更精簡(jiǎn)的特征序列,去除冗余特征,在特征約減方面,提出了基于多目標(biāo)遺傳算法的虹膜融合特征約減方法;第三項(xiàng)工作是在構(gòu)造虹膜分類(lèi)器方面,過(guò)去的虹膜識(shí)別方法一般采用距離的方法包括歐幾里得距離和漢明距離來(lái)分類(lèi),或?qū)Υa本進(jìn)行異或操作,這些都是簡(jiǎn)單的計(jì)算方法。為了得到更高的識(shí)別率,我們將學(xué)習(xí)機(jī)制引入虹膜識(shí)別。同時(shí)考慮到在生物認(rèn)證領(lǐng)域,錯(cuò)誤接受和錯(cuò)誤拒絕的代價(jià)是不一樣的,需要在訓(xùn)練中進(jìn)行區(qū)別對(duì)待。在安全性要求較高的應(yīng)用中,對(duì)于錯(cuò)誤接受的樣本應(yīng)該比錯(cuò)誤拒絕的樣本施以更大懲罰。因此為了適應(yīng)虹膜識(shí)別等生物特征識(shí)別在不同安全等級(jí)中的應(yīng)用,提出并實(shí)現(xiàn)了非對(duì)稱(chēng)支持向量機(jī)NONSYMMETRICALSUPPTVECTMACHINE,NSVM作為虹膜樣本的分類(lèi)器,以適應(yīng)安全性要求不同的應(yīng)用場(chǎng)合;第四項(xiàng)工作是基于所提出的算法與理論,實(shí)現(xiàn)了一個(gè)新的虹膜識(shí)別系統(tǒng)原型并命名為IRISPASSPT,在CASIA虹膜公開(kāi)數(shù)據(jù)庫(kù)上做了測(cè)試,并與現(xiàn)有算法與理論進(jìn)行了對(duì)比。在本文的第六章介紹了IRISPASSPT系統(tǒng)結(jié)構(gòu)及其特性;我們的這些工作是提高虹膜識(shí)別系統(tǒng)性能的有益嘗試,實(shí)驗(yàn)結(jié)果表明IRISPASSPT的性能基本上達(dá)到了實(shí)際應(yīng)用的要求。最后對(duì)全文進(jìn)行了概括性總結(jié),并指出了理論和應(yīng)用上有待進(jìn)一步研究的方向。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-10
頁(yè)數(shù): 111
大?。?3.76(MB)
子文件數(shù):
-
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 78
大小: 14.07(MB)
子文件數(shù):
-
簡(jiǎn)介:該文主要目的是研究語(yǔ)音魯棒處理技術(shù)提高噪聲環(huán)境中語(yǔ)音切分的魯棒性然后在此基礎(chǔ)上具體實(shí)現(xiàn)語(yǔ)音庫(kù)建設(shè)輔助工具該文首先基于人類(lèi)的聽(tīng)視感知模型研究了語(yǔ)音信號(hào)的時(shí)頻分析方法構(gòu)造了滿(mǎn)足聽(tīng)覺(jué)感知模型的非均勻完全重構(gòu)濾波器組完成了基于最大似然估計(jì)的子帶語(yǔ)音去噪算法實(shí)現(xiàn)了基于MDL最小描述長(zhǎng)度的自適應(yīng)平滑子帶語(yǔ)音魯棒端點(diǎn)檢測(cè)算法其次討論了基于隱馬爾可夫模型語(yǔ)音切的缺陷指出了韻律因素對(duì)語(yǔ)音切分的影響提出了語(yǔ)音魯棒切分的貝葉斯框架最后描述了標(biāo)注圖的主要思想提出院了基于XML的語(yǔ)音標(biāo)注體系結(jié)構(gòu)并利用可擴(kuò)展標(biāo)注語(yǔ)音XML、VISUALBASIC和SQL實(shí)現(xiàn)了語(yǔ)音庫(kù)建設(shè)輔助工具的原形系統(tǒng)具體標(biāo)注了孤立數(shù)字語(yǔ)音庫(kù)、邊疆?dāng)?shù)字串語(yǔ)音庫(kù)和用于說(shuō)話人識(shí)別的特殊語(yǔ)音庫(kù)
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 115
大?。?1.64(MB)
子文件數(shù):
-
簡(jiǎn)介:近年來(lái)隨著人類(lèi)對(duì)海洋認(rèn)識(shí)和探索的進(jìn)一步深入加大對(duì)海洋信息的掌控在現(xiàn)實(shí)生活中顯得愈發(fā)重要其中對(duì)水面目標(biāo)的自動(dòng)識(shí)別就是最重要的課題之一。由于水面情況復(fù)雜不可預(yù)測(cè)的因素較多這給實(shí)現(xiàn)水面目標(biāo)的自動(dòng)識(shí)別帶來(lái)了相當(dāng)大的困難。在基于目標(biāo)輪廓特征提取與識(shí)別方面兩種傳統(tǒng)方法基于不變矩和基于PCA主分量分析是針對(duì)全局特征進(jìn)行自動(dòng)目標(biāo)識(shí)別的由于是在模擬條件下進(jìn)行的估計(jì)又由于ROI感興趣區(qū)域算法的定位不夠準(zhǔn)確因此這兩種方法在識(shí)別時(shí)有很大的局限性。本文中我們首先對(duì)圖像模式識(shí)別的基本理論、方法及應(yīng)用現(xiàn)狀進(jìn)行了分析結(jié)合水面目標(biāo)識(shí)別的要求對(duì)圖像預(yù)處理相關(guān)的內(nèi)容進(jìn)行了研究主要針對(duì)脈沖噪聲的濾除和圖像分割兩方面進(jìn)行探討并根據(jù)實(shí)驗(yàn)結(jié)果的比對(duì)確定了圖像濾波和分割的方法。其次通過(guò)對(duì)基于不變矩和主分量分析的目標(biāo)識(shí)別方法的研究及結(jié)果分析我們提出了一種基于目標(biāo)局部特征的由逐塊的二維HADAMARD變換和高斯混合模型分類(lèi)器組成的方法。實(shí)驗(yàn)表明這種方法對(duì)目標(biāo)超出視野范圍的情況有很好的魯棒性對(duì)由于深度的影響而產(chǎn)生的比例變化也有一定的魯棒性。傳統(tǒng)方法在進(jìn)行目標(biāo)自動(dòng)識(shí)別時(shí)不變矩方法即使在較好的環(huán)境中識(shí)別效果也很差并且當(dāng)目標(biāo)超出視野范圍或被遮擋時(shí)影響更為明顯。PCA方法受比例變化和超出視野范圍的影響也很大而對(duì)噪聲和被遮擋有相對(duì)較好的魯棒性。最后本文針對(duì)目標(biāo)識(shí)別過(guò)程中訓(xùn)練和測(cè)試的輪廓角度由平面外的旋轉(zhuǎn)引起的不相符的情況通過(guò)使用幾個(gè)空間相距很遠(yuǎn)的角度來(lái)實(shí)現(xiàn)訓(xùn)練集合的擴(kuò)展從而完成對(duì)目標(biāo)的識(shí)別。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-11
頁(yè)數(shù): 68
大?。?2.2(MB)
子文件數(shù):
-
簡(jiǎn)介:隨著因特網(wǎng)的蓬勃發(fā)展、社會(huì)的數(shù)字化變革以及經(jīng)濟(jì)的快速發(fā)展,數(shù)據(jù)的規(guī)模正在以驚人的速度不斷增長(zhǎng)。如何從大量數(shù)據(jù)中提取所蘊(yùn)藏著的有價(jià)值信息變得越來(lái)越重要,由此,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。數(shù)據(jù)挖掘算法也越來(lái)越受到人們的重視,其中許多算法和模型都建立在理想的數(shù)據(jù)集上,而現(xiàn)實(shí)中的數(shù)據(jù)集通常存在著數(shù)據(jù)不完整的情況,即數(shù)據(jù)記錄中含有缺失值的情況。對(duì)于缺失數(shù)據(jù),通常采用某種清洗方法對(duì)其進(jìn)行處理,然后在處理后生成的完整數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘。目前應(yīng)用在缺失值插補(bǔ)上的方法有很多,它們各有其優(yōu)缺點(diǎn)。本文在對(duì)缺失值插補(bǔ)方法進(jìn)行了大量研究和分析后,針對(duì)具有聚類(lèi)特征的數(shù)據(jù)集提出了一種變量選擇、回歸預(yù)插補(bǔ)、聚類(lèi)分析、回歸插補(bǔ)的缺失值清洗框架,該框架構(gòu)成了基于統(tǒng)計(jì)學(xué)習(xí)的缺失值清洗方法。此外,針對(duì)本文提出的缺失值插補(bǔ)方法,在深入研究KMEANS算法的優(yōu)缺點(diǎn)后,提出一種改進(jìn)的聚類(lèi)算法。并在實(shí)現(xiàn)過(guò)程中提出了整個(gè)缺失值清洗過(guò)程的流程。最后分別在聚類(lèi)數(shù)據(jù)集上、隨機(jī)數(shù)據(jù)集和真實(shí)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)。通過(guò)與其他缺失值插補(bǔ)方法在插補(bǔ)效果上的比較,實(shí)驗(yàn)驗(yàn)證了本文提出的方法的有效性。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 61
大?。?5.37(MB)
子文件數(shù):
-
簡(jiǎn)介:布匹瑕疵檢測(cè)作為一種質(zhì)量保證手段目前主要通過(guò)人工來(lái)完成,工作強(qiáng)度大且效率低下,采用自動(dòng)化的機(jī)器檢測(cè)成為一種合理的選擇。本文研究了布匹瑕疵自動(dòng)檢測(cè)與分類(lèi)的算法,主要工作如下奇異值分解SVD是一種有效的代數(shù)特征提取方法,本文首先研究了基于SVD理論的瑕疵檢測(cè)與分類(lèi)算法。瑕疵檢測(cè)階段,充分利用奇異值分解所生成的奇異值和奇異值特征向量信息,實(shí)現(xiàn)瑕疵分割;提取瑕疵區(qū)域基于奇異值的特征,應(yīng)用BP神經(jīng)網(wǎng)絡(luò)分類(lèi)器實(shí)現(xiàn)瑕疵分類(lèi)。針對(duì)布匹瑕疵的不規(guī)則形狀和紋理特征,本文研究了一種基于GAB小波網(wǎng)絡(luò)GWN和支持向量機(jī)SVM的瑕疵檢測(cè)與分類(lèi)算法。應(yīng)用GWN模擬逼近布匹圖像的背景紋理,構(gòu)造最優(yōu)GAB濾波器,實(shí)現(xiàn)瑕疵分割;提取基于灰度共生矩陣的瑕疵特征,應(yīng)用SVM實(shí)現(xiàn)了瑕疵分類(lèi),取得較好的檢測(cè)和分類(lèi)效果。針對(duì)較難檢測(cè)的輕微瑕疵,本文又單獨(dú)研究了一種基于平穩(wěn)小波變換SWT和非下采樣方向?yàn)V波器組NSDFB的瑕疵檢測(cè)算法,將多尺度分解和多方向分解在兩個(gè)步驟中獨(dú)立的進(jìn)行,允許在不同的尺度上選擇分解不同的方向數(shù),提供了一種靈活的多尺度和多方向展開(kāi),應(yīng)用SVM構(gòu)建二分類(lèi)模型,實(shí)現(xiàn)瑕疵分割。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 76
大小: 3.11(MB)
子文件數(shù):
-
簡(jiǎn)介:文化經(jīng)濟(jì)一體化已成為當(dāng)代社會(huì)經(jīng)濟(jì)活動(dòng)的顯著特征。隨著文化地理學(xué)的“經(jīng)濟(jì)轉(zhuǎn)向”,文化區(qū)及文化區(qū)劃研究逐步與經(jīng)濟(jì)發(fā)展相結(jié)合,文化區(qū)的功能性特征日趨明顯。文化區(qū)研究有助于從空間角度梳理地區(qū)文化脈絡(luò),為地區(qū)政治決策、文化建設(shè)的空間布局規(guī)劃提供參考依據(jù),并有助于服務(wù)于其他專(zhuān)項(xiàng)文化研究。本文以浙江省為研究對(duì)象,通過(guò)總結(jié)歸納文化區(qū)劃理論方法,嘗試對(duì)浙江文化區(qū)空間特征進(jìn)行研究,以期在一定程度上充實(shí)和拓展文化區(qū)、文化地理學(xué)領(lǐng)域的研究?jī)?nèi)容。本文首先闡述了論文的研究背景及意義,對(duì)國(guó)內(nèi)外研究現(xiàn)狀進(jìn)行了總括性述評(píng),并對(duì)文化區(qū)空間結(jié)構(gòu)、文化區(qū)劃方法、文化景觀概念進(jìn)行了理性探討。然后選取浙江省國(guó)家級(jí)和省級(jí)文物保護(hù)單位和非物質(zhì)文化遺產(chǎn)為典型文化景觀,以傳統(tǒng)民居、傳統(tǒng)橋梁、民間信仰和歲時(shí)節(jié)慶為主導(dǎo)指標(biāo),通過(guò)對(duì)文化景觀的詳細(xì)分析和空間定位,得出四類(lèi)專(zhuān)項(xiàng)文化區(qū)劃在此基礎(chǔ)上結(jié)合浙江自然地理和方言格局,采用圖形疊加方法,得出均質(zhì)結(jié)構(gòu)下的浙江綜合文化區(qū)劃。同時(shí)以浙江文化景觀密度為數(shù)據(jù)基礎(chǔ),運(yùn)用地統(tǒng)計(jì)學(xué)方法生成浙江文化景觀密度分布圖,以此為基礎(chǔ)分析浙江文化空間的功能格局并將浙江綜合文化區(qū)劃與功能文化區(qū)進(jìn)行比較,分析文化區(qū)之間的功能關(guān)系。最后從區(qū)域經(jīng)濟(jì)發(fā)展、旅游開(kāi)發(fā)、文化資源開(kāi)發(fā)、城市建設(shè)等角度出發(fā),提出浙江區(qū)域文化協(xié)調(diào)發(fā)展的空間格局。根據(jù)上述分析,本文得出以下結(jié)論1浙江可以劃分為浙北、浙東、浙中和浙南四個(gè)文化區(qū),其中浙北文化區(qū)以“水”文化為特色浙東文化區(qū)以“?!蔽幕癁樘厣隳衔幕瘏^(qū)以“山?!蔽幕癁樘厣в虚}文化的烙印浙中文化區(qū)面積最為廣闊,以過(guò)渡性文化為特色,帶有徽文化烙印。2浙江可劃分為分別以環(huán)杭州灣地區(qū)、寧波、金衢地區(qū)和溫州為核心的浙北、浙東、浙中和浙南四個(gè)文化功能區(qū),且文化功能區(qū)呈核心外圍過(guò)渡結(jié)構(gòu),外圍地區(qū)對(duì)文化中心有強(qiáng)烈的依賴(lài)性,存在文化過(guò)渡性特征明顯的邊緣區(qū)域。浙北、浙東、浙中文化區(qū)功能聯(lián)系緊密,形成一個(gè)文化功能整體,其中浙中深處環(huán)杭州灣地區(qū)腹地,實(shí)則是最具文化原生特征的地區(qū),浙南文化區(qū)則自成體系。3浙江均質(zhì)文化區(qū)與功能文化區(qū)格局大致重合。浙北文化區(qū)的功能與均質(zhì)結(jié)構(gòu)高度重合浙中功能文化區(qū)相比均質(zhì)結(jié)構(gòu)范圍縮小,說(shuō)明金衢地區(qū)的文化中心作用并不顯著浙南功能文化區(qū)相比均質(zhì)結(jié)構(gòu)明顯縮小,說(shuō)明浙南文化功能區(qū)在全省呈收縮趨勢(shì),文化功能作用弱化,以環(huán)杭州灣地區(qū)為核心的浙北、浙東和浙中文化功能區(qū)有擴(kuò)張趨勢(shì)。4自然地理是浙江文化區(qū)形態(tài)的重要影響因素,其中地貌是浙江文化空間功能結(jié)構(gòu)的主控制因子,水系是浙江文化空間功能結(jié)構(gòu)形成的副控制因子。浙江歷史文化名城、浙江城鎮(zhèn)體系規(guī)劃、浙江產(chǎn)業(yè)體系規(guī)劃等浙江區(qū)域發(fā)展的空間布局成果,與浙江文化區(qū)在空間上大致對(duì)應(yīng),說(shuō)明現(xiàn)代經(jīng)濟(jì)活動(dòng)也對(duì)文化區(qū)形態(tài)產(chǎn)生影響,文化傳承與現(xiàn)代經(jīng)濟(jì)活動(dòng)相輔相成、相互促進(jìn)。5提出以環(huán)杭州灣地區(qū)、溫州為兩個(gè)文化主中心,以寧波和金衢地區(qū)為兩個(gè)文化副中心,以浙北、浙東、浙中和浙南文化區(qū)為四類(lèi)文化發(fā)展區(qū)域的浙江區(qū)域文化發(fā)展的空間結(jié)構(gòu)體系。論文還提出一些不足之處,主要包括由文化景觀范疇寬泛、界定模糊、分布不均帶來(lái)的文化區(qū)劃研究的偏差問(wèn)題。最后提出文化區(qū)劃與城鎮(zhèn)體系、產(chǎn)業(yè)布局、文化產(chǎn)業(yè)、遺產(chǎn)保護(hù)等不同領(lǐng)域的規(guī)劃實(shí)踐相結(jié)合還值得進(jìn)一步探索的未來(lái)展望。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 91
大?。?10.88(MB)
子文件數(shù):
-
簡(jiǎn)介:20世紀(jì)90年代以來(lái),信息科學(xué)的發(fā)展面臨著種種新的難題,主要包括知識(shí)表示、信息組織、軟件利用等。特別是由于因特網(wǎng)的快速發(fā)展,如何組織、管理和維護(hù)大量信息并為用戶(hù)提供有效的服務(wù)也就成為一項(xiàng)重要而迫切的研究任務(wù)。為適應(yīng)這些要求,哲學(xué)領(lǐng)域的本體被引入信息科學(xué)領(lǐng)域,由于國(guó)內(nèi)外眾多學(xué)者的研究,已經(jīng)發(fā)展成為能在語(yǔ)義和知識(shí)層次上描述信息系統(tǒng)的概念模型建模工具,并在信息檢索、信息抽取、異構(gòu)信息系統(tǒng)的互操作和集成、語(yǔ)義WEB等領(lǐng)域得到了廣泛應(yīng)用。本文主要圍繞本體生成技術(shù)及本體的優(yōu)化方法進(jìn)行展開(kāi)。論文在分析當(dāng)前經(jīng)典本體生成方法的基礎(chǔ)上,提出了基于FCA與統(tǒng)計(jì)學(xué)習(xí)相結(jié)合的本體生成算法,提出了在應(yīng)用FCA相關(guān)理論生成概念格時(shí)的四個(gè)統(tǒng)計(jì)量,構(gòu)造了基于FCA與統(tǒng)計(jì)學(xué)習(xí)相結(jié)合生成的概念格到本體的映射過(guò)程;基于FCA中概念格的現(xiàn)有理論,特別是繼承概念格理論,得出有關(guān)冗余概念的推論和優(yōu)化概念格的定義,從而形成了本體優(yōu)化算法的基礎(chǔ);論文還對(duì)本體遷移學(xué)習(xí)進(jìn)行了研究。通過(guò)以上本體生成及優(yōu)化過(guò)程,能夠得到比較理想的本體結(jié)構(gòu)。最后本文給出了本體生成的框架模型和可視化本體生成平臺(tái)。通過(guò)本文提出的本體生成技術(shù)與方法,能夠準(zhǔn)確地提取領(lǐng)域知識(shí),建立結(jié)構(gòu)清晰、重點(diǎn)突出的領(lǐng)域知識(shí)本體,對(duì)于有效組織、管理和維護(hù)大量信息,有效地從大量信息中提取關(guān)鍵知識(shí)具有重要意義。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 60
大小: 2.68(MB)
子文件數(shù):
-
簡(jiǎn)介:數(shù)據(jù)挖掘是近幾年隨著數(shù)據(jù)庫(kù)和人工智能發(fā)展起來(lái)的一門(mén)新興技術(shù),它從大量原始數(shù)據(jù)中發(fā)掘出隱含的、有用的信息和知識(shí),幫助決策者尋找數(shù)據(jù)間潛在的關(guān)聯(lián),發(fā)現(xiàn)被忽略的因素。數(shù)據(jù)挖掘因其巨大的商業(yè)前景,現(xiàn)已成為國(guó)際上數(shù)據(jù)庫(kù)和信息決策領(lǐng)域最前沿的研究方向之一,并引起了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。面對(duì)海量數(shù)據(jù),首要的任務(wù)就是對(duì)其進(jìn)行歸類(lèi),聚類(lèi)分析就是對(duì)原始數(shù)據(jù)進(jìn)行合理歸類(lèi)的一種方法。作為數(shù)據(jù)挖掘的一項(xiàng)重要功能,聚類(lèi)分析能作為一個(gè)獨(dú)立的工具來(lái)獲得數(shù)據(jù)的分布情況,觀察每個(gè)類(lèi)的特點(diǎn),集中對(duì)特定的某些類(lèi)做進(jìn)一步的分析。此外,聚類(lèi)分析也可以作為其它算法的預(yù)處理步驟。因此,聚類(lèi)分析已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中一個(gè)非常活躍的研究課題。數(shù)據(jù)挖掘的相關(guān)文獻(xiàn)中已經(jīng)存在大量的聚類(lèi)方法。然而,從目前來(lái)看,對(duì)數(shù)據(jù)挖掘中聚類(lèi)方法的研究大都集中于計(jì)算機(jī)科學(xué)領(lǐng)域,更多注重聚類(lèi)算法的研究,或者對(duì)現(xiàn)有聚類(lèi)方法進(jìn)行算法上的改進(jìn),而很少真正從統(tǒng)計(jì)學(xué)角度出發(fā)對(duì)數(shù)據(jù)挖掘中的聚類(lèi)問(wèn)題進(jìn)行深入分析。本文嘗試從統(tǒng)計(jì)學(xué)視角出發(fā),以統(tǒng)計(jì)理論為基礎(chǔ),以統(tǒng)計(jì)方法與算法的結(jié)合為基本思路,將一些現(xiàn)有的優(yōu)秀統(tǒng)計(jì)方法,如因子分析、對(duì)應(yīng)分析、函數(shù)型數(shù)據(jù)分析等引入數(shù)據(jù)挖掘領(lǐng)域,使其能夠應(yīng)用于海量數(shù)據(jù)的聚類(lèi)分析。本文共分為六章,各章的內(nèi)容安排如下第1章介紹了本文的選題背景、研究?jī)?nèi)容以及本文的主要?jiǎng)?chuàng)新之處。第2章首先簡(jiǎn)單闡述了數(shù)據(jù)挖掘的定義、功能和常用技術(shù),然后對(duì)當(dāng)前數(shù)據(jù)挖掘中主要的聚類(lèi)方法及其研究進(jìn)展進(jìn)行了綜述,并從聚類(lèi)標(biāo)準(zhǔn)、類(lèi)的標(biāo)識(shí)、聚類(lèi)算法框架三個(gè)角度對(duì)各種聚類(lèi)方法進(jìn)行了全面而深入的對(duì)比與總結(jié)。第3章通過(guò)對(duì)經(jīng)典Q型因子模型進(jìn)行改進(jìn),克服了其算法效率上的困難,提出了一種新的海量數(shù)據(jù)聚類(lèi)方法Q型因子聚類(lèi)法,并將其成功應(yīng)用于上市公司板塊分析,為投資決策提供幫助。第4章基于BENZéCRI對(duì)應(yīng)分析的基本思路,結(jié)合Q型因子分析的思想,提出了數(shù)據(jù)挖掘中的對(duì)應(yīng)分析聚類(lèi)法。利用對(duì)應(yīng)分析聚類(lèi)法對(duì)移動(dòng)通訊月度消費(fèi)大型數(shù)據(jù)庫(kù)進(jìn)行聚類(lèi)分析,實(shí)現(xiàn)了移動(dòng)通訊消費(fèi)市場(chǎng)的細(xì)分。第5章借助函數(shù)型數(shù)據(jù)分析的基本思想和方法,建立了一個(gè)時(shí)序數(shù)據(jù)庫(kù)聚類(lèi)分析的一般框架,并將這一方法擴(kuò)展到多變量的情形,解決了多變量時(shí)序數(shù)據(jù)的聚類(lèi)問(wèn)題。將該方法應(yīng)用到投資組合風(fēng)險(xiǎn)管理中,利用聚類(lèi)結(jié)果進(jìn)行資產(chǎn)選擇,有效地降低了組合投資風(fēng)險(xiǎn)。第6章對(duì)全文的主要工作進(jìn)行了總結(jié),并指出了本文的不足之處以及進(jìn)一步研究的方向。本文嘗試在以下幾個(gè)方面有所創(chuàng)新1通過(guò)對(duì)經(jīng)典Q型因子模型進(jìn)行改進(jìn),克服了其算法效率上的困難,提出了一種新的海量數(shù)據(jù)聚類(lèi)方法“Q型因子聚類(lèi)法”。2提出了數(shù)據(jù)挖掘中的“對(duì)應(yīng)分析聚類(lèi)法”。該方法既解決了Q型因子分析算法效率方面的問(wèn)題,也解決了傳統(tǒng)對(duì)應(yīng)分析法中缺乏客觀分類(lèi)標(biāo)準(zhǔn)、信息損失嚴(yán)重等多種缺陷。3在對(duì)應(yīng)分析聚類(lèi)法的提出過(guò)程中,構(gòu)造了對(duì)應(yīng)分析中的標(biāo)準(zhǔn)化因子載荷陣,給出了對(duì)應(yīng)分析中因子得分的求解方法,并首次將因子旋轉(zhuǎn)引入對(duì)應(yīng)分析中,在一定程度上擴(kuò)展了對(duì)應(yīng)分析的方法和理論體系。4借助函數(shù)型數(shù)據(jù)分析的基本思想和方法,建立了一個(gè)時(shí)序數(shù)據(jù)庫(kù)聚類(lèi)分析的一般框架,在這個(gè)框架之下,大量傳統(tǒng)的靜態(tài)聚類(lèi)方法都可以被應(yīng)用到時(shí)序數(shù)據(jù)聚類(lèi)當(dāng)中。
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 115
大小: 5.24(MB)
子文件數(shù):
-
簡(jiǎn)介:碩士學(xué)位論文碩士學(xué)位論文巖體裂隙分組的拓?fù)鋵W(xué)及數(shù)理統(tǒng)計(jì)分析巖體裂隙分組的拓?fù)鋵W(xué)及數(shù)理統(tǒng)計(jì)分析TOPOLOGICALSTATISTICALSTUDYONGROUPINGOFFRACTURESFJOINTEDROCKMASS韓小良韓小良2010年12月CLASSIFIEDINDEXTU44135UDC624DISSERTATIONFTHEMASTERDEGREEINENGINEERINGTOPOLOGICALSTATISTICALSTUDYONGROUPINGOFFRACTURESFJOINTEDROCKMASSCIDATEHANXIAOLIANGSUPERVISASSOCIATEPROFLEIWEIDONGACADEMICDEGREEAPPLIEDFMASTEROFENGINEERINGSPECIALITYCIVILENGINEERINGAFFILIATIONSHENZHENGRADUATESCHOOLDATEOFDEFENCEDECEMBER2010DEGREECONFERRINGINSTITUTIONHARBININSTITUTEOFTECHNOLOGY
下載積分: 5 賞幣
上傳時(shí)間:2024-03-09
頁(yè)數(shù): 79
大?。?1.84(MB)
子文件數(shù):