版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。經(jīng)過這數(shù)十年的發(fā)展,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為處理化學(xué)化工數(shù)據(jù)的常規(guī)手段。 本文將支持向量機(jī)(supportvectormachine,SVM),一種特別適合用有限已知樣本訓(xùn)練建模,進(jìn)而預(yù)報(bào)未知樣本屬性的數(shù)據(jù)挖掘新算法應(yīng)用于若干化合物體系的構(gòu)效關(guān)系研究。由于支持向量機(jī)算法的數(shù)學(xué)理論非常嚴(yán)
2、格,同時(shí)考慮到擬合精度和對(duì)過擬合的抑制,故能基于小樣本集作較可靠的計(jì)算機(jī)預(yù)報(bào)。其對(duì)所選體系的數(shù)據(jù)處理均得到了較好的預(yù)報(bào)結(jié)果,充分展現(xiàn)了SVM算法的優(yōu)點(diǎn)和廣闊的應(yīng)用前景。主要研究工作分三部分: 第一部分支持向量分類(SVC)算法用于藥物構(gòu)效關(guān)系研究。本工作由兩個(gè)章節(jié)構(gòu)成。 (1)3-甲基芬太尼衍生物(3-MF)的鎮(zhèn)痛活性研究。將支持向量分類(supportvectorclassification,SVC)算法用于3-MF及
3、其衍生物結(jié)構(gòu)與鎮(zhèn)痛活性關(guān)系的研究,用SVM預(yù)報(bào)結(jié)果來篩選結(jié)構(gòu)參數(shù)。所建SVC模型分類結(jié)果為95.12%,對(duì)41個(gè)3-MF的活性類別留一法預(yù)報(bào)正確率為92.68%,明顯高于主成分分析法(PCA)(85.37%),F(xiàn)isher法(87.80%)和KNN法(87.80%)。 (2)三唑類衍生物的抗真菌活性研究。用HyperchemTM軟件計(jì)算了23個(gè)該類藥物分子的量子化學(xué)參數(shù),基于SVM的特征篩選方法找出了影響活性目標(biāo)變量的主要特征參
4、數(shù),用SVC算法建立了活性與參數(shù)間的定性模型并用留一法進(jìn)行了類別預(yù)報(bào)。結(jié)果為:訓(xùn)練集的分類正確率為91.3%,留一法預(yù)報(bào)正確率為91.3%,優(yōu)于傳統(tǒng)的PCA方法(83%)和KNN方法(74%)。在此基礎(chǔ)上,進(jìn)行了三唑類藥物分子的初步設(shè)計(jì)工作。 第二部分支持向量回歸(supportvectormachine,SVR)算法用于二取代[(吖啶-4-酰胺基)丙基]甲胺類衍生物的活性研究。在通過HyperchemTM軟件計(jì)算了40個(gè)該類藥
5、物分子的量子化學(xué)參數(shù)以及特征參數(shù)篩選后,用SVR算法對(duì)化合物的活性進(jìn)行了定量建模和留一法預(yù)報(bào)。SVR建模的相對(duì)誤差為4.47%,優(yōu)于線性回歸算法(5.58%);留一法預(yù)報(bào)相對(duì)誤差為6.819%,優(yōu)于人工神經(jīng)網(wǎng)絡(luò)(ANN)算法(8.099%)。 第三部分支持向量回歸(SVR)算法用于偶氮染料分子的結(jié)構(gòu)性質(zhì)研究。將SVM特征篩選方法對(duì)已知偶氮染料分子分子描述符進(jìn)行了壓縮提取,討論了有關(guān)結(jié)果。用特征篩選后的分子描述符構(gòu)建了染料分子親合
6、力的SVR模型,并用留一法考察了SVR模型的預(yù)報(bào)能力與可靠性,同時(shí)還用多種傳統(tǒng)方法對(duì)該體系進(jìn)行了研究。結(jié)果是:ANN擬合最好,其平均相對(duì)誤差MRE僅0.28%,優(yōu)于SVR5.09%,MLR6.16%,PLS6.41%;SVR的預(yù)報(bào)正確率最高,其MRE為6.60%,而在訓(xùn)練中擬合最好的ANN其預(yù)報(bào)的MRE為10.89%,低于MLR9.30%和PLS9.52%。結(jié)果表明:與人工神經(jīng)網(wǎng)絡(luò)(ANN)法、多元線性回歸(MLR)法和偏最小二乘(PL
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 支持向量機(jī)算法在有機(jī)化合物構(gòu)效關(guān)系中的應(yīng)用.pdf
- 茶多酚及其金屬化合物構(gòu)效關(guān)系的研究.pdf
- 支持向量機(jī)用于二噁英類有機(jī)污染物的定量構(gòu)效研究.pdf
- 染料類化合物多種性質(zhì)的定量構(gòu)效關(guān)系研究.pdf
- 含硫、氧有機(jī)化合物的定量構(gòu)效關(guān)系研究.pdf
- 喹喔啉類化合物的合成及構(gòu)效關(guān)系研究.pdf
- 四種珊瑚中化學(xué)防御化合物及其構(gòu)效關(guān)系研究.pdf
- 基于數(shù)據(jù)挖掘的若干化工過程優(yōu)化和化合物構(gòu)效關(guān)系研究.pdf
- 新型微管蛋白抑制劑先導(dǎo)化合物的優(yōu)化及其構(gòu)效關(guān)系研究.pdf
- 黃酮類化合物的提取分離及定量構(gòu)效關(guān)系研究.pdf
- 番荔枝內(nèi)酯類化合物的分離、構(gòu)效關(guān)系及毒性研究.pdf
- 新型噠嗪酮類化合物的設(shè)計(jì)、合成及構(gòu)效關(guān)系研究.pdf
- 黃酮類化合物抗氧化活性和苯胺-酚類化合物毒性的構(gòu)效關(guān)系研究.pdf
- 抗腫瘤化合物定量構(gòu)效關(guān)系、對(duì)接及分子設(shè)計(jì)的理論研究.pdf
- 具有抗癌活性的喜樹堿類化合物的構(gòu)效關(guān)系研究.pdf
- 新型有機(jī)錫類抗癌化合物的設(shè)計(jì)合成及其構(gòu)效關(guān)系的研究.pdf
- 苯駢唑類化合物電子光譜及其構(gòu)效關(guān)系研究.pdf
- 多羰基化合物互變異構(gòu)及構(gòu)效關(guān)系的理論研究.pdf
- 幾類典型有機(jī)化合物的化學(xué)結(jié)構(gòu)表征及定量構(gòu)效關(guān)系研究.pdf
- 烷基酚類化合物生態(tài)效應(yīng)的構(gòu)效相關(guān)研究.pdf
評(píng)論
0/150
提交評(píng)論