大數(shù)據(jù)環(huán)境下分子檢索與藥物候選物識別研究.pdf_第1頁
已閱讀1頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、近年來,伴隨中國國民經(jīng)濟持續(xù)發(fā)展和化工產(chǎn)業(yè)的不斷進步,組合化學(xué)和高通量篩選技術(shù)的持續(xù)探索研究產(chǎn)生了大量化合物數(shù)據(jù)。在短時間內(nèi)可以合成大量多樣化的分子,但是分子性質(zhì)和功能性質(zhì)獲取速度相對較慢,這在一定程度上阻礙了在計算化學(xué)、化學(xué)信息學(xué)和藥物設(shè)計領(lǐng)域的研究。傳統(tǒng)的檢索方法已取得一定研究成果,可實現(xiàn)對小規(guī)模分子數(shù)據(jù)的處理,然而目前分子數(shù)據(jù)規(guī)模呈現(xiàn)爆炸式增長的趨勢,現(xiàn)有的分子處理系統(tǒng)的運算分析水平有限,化合物檢索速度成為研究的瓶頸。同時由于光纖

2、材料、隱形材料研究領(lǐng)域的探索都對分子折射率有所關(guān)注,關(guān)于分子折射率的檢索具有十分重要的實際意義。最后,針對大量多樣性的化合物,如何篩選出高質(zhì)量的藥物候選物成為藥物研究方面的熱點。
  本文系統(tǒng)的開展了分子檢索和識別研究,研究工作的內(nèi)容主要分為兩部分。在第一部分中,當前大數(shù)據(jù)的環(huán)境下,分析了傳統(tǒng)的化學(xué)分子結(jié)構(gòu)檢索方法,提出了基于分子屬性篩選的VF2算法,建立了基于分布式的化合物檢索模型。對實驗結(jié)果進行分析得出以下結(jié)論,在大數(shù)據(jù)環(huán)境下

3、實現(xiàn)了對包括特定信息化合物的高效檢索,檢索復(fù)雜度得到降低。另外結(jié)合分子屬性特點,在分析研究了經(jīng)典高效的化合物檢索算法后,通過等寬算法離散化連續(xù)的化合物折射率,建立高速的哈希索引,最終實現(xiàn)了基于分布式的一致性哈希檢索模型,減小檢索的計算量,使得效率提升。實驗結(jié)果表明,該方法實現(xiàn)分子數(shù)據(jù)的快速定位,有效降低了平均檢索耗時,模型性能穩(wěn)定,具有高可擴展性。
  在第二部分中,本文收集了共計1555個化合物,其中包括兩類數(shù)據(jù)即藥物和非藥物,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論