本文摘要:摘要:計(jì)算機(jī)信息技術(shù)已經(jīng)滲透到我們生活的方方面面,不僅可以輔助藥物的篩選,也能夠模擬藥物的作用。目前已有研究使用計(jì)算機(jī)輔助技術(shù)篩選適配體,對(duì)篩選效率的提升和篩選高親和力的適配體有著重要的指導(dǎo)作用。文中將主要對(duì)計(jì)算機(jī)通過序列評(píng)估、結(jié)構(gòu)分析、分
摘要:計(jì)算機(jī)信息技術(shù)已經(jīng)滲透到我們生活的方方面面,不僅可以輔助藥物的篩選,也能夠模擬藥物的作用。目前已有研究使用計(jì)算機(jī)輔助技術(shù)篩選適配體,對(duì)篩選效率的提升和篩選高親和力的適配體有著重要的指導(dǎo)作用。文中將主要對(duì)計(jì)算機(jī)通過序列評(píng)估、結(jié)構(gòu)分析、分子對(duì)接3個(gè)方面輔助適配體篩選的方法進(jìn)行綜述。
關(guān)鍵詞:適配體,指數(shù)富集的配體系統(tǒng)進(jìn)化技術(shù),計(jì)算機(jī)輔助篩選,序列評(píng)估,結(jié)構(gòu)分析,分子對(duì)接
核酸適配體是指一種能夠與特定目標(biāo)物發(fā)生高親和力和特異性結(jié)合的寡核苷酸片段,通過配體指數(shù)富集的配體系統(tǒng)進(jìn)化技術(shù)(Exponentially enrichedligandsystemevolution,SELEX)從隨機(jī)文庫中篩選獲得的功能性核苷酸,大小一般約為6–40bp,具有一些特殊的二級(jí)結(jié)構(gòu),如發(fā)夾、莖環(huán)、假結(jié)、G-四聯(lián)體等,能讓適配體可以形成多種三級(jí)結(jié)構(gòu),使其能夠與靶物質(zhì)結(jié)合。
1990年Tuerk等[1]就首次通過SELEX從65536個(gè)序列的預(yù)測(cè)池中篩選出了兩個(gè)不同的序列,它們可以與T4DNA聚合酶相互作用。經(jīng)過數(shù)十年的改進(jìn),SELEX技術(shù)已經(jīng)成為一種重要的研究方法和工具,其基本原理是體外化學(xué)合成一個(gè)單鏈寡核苷酸庫,包括大量隨機(jī)單鏈DNA或RNA(1016–1018個(gè)單鏈),用它與靶物質(zhì)(包括金屬離子、小分子、大分子、細(xì)胞、組織以及混合靶標(biāo)等)混合,同時(shí)洗脫混合液中未與靶物質(zhì)結(jié)合的核酸,保留與靶物質(zhì)結(jié)合的核酸分子,隨后分離與靶物質(zhì)結(jié)合的核酸分子,再以此為模板進(jìn)行PCR擴(kuò)增,進(jìn)行下一輪篩選。
通過重復(fù)篩選,一些與靶物質(zhì)不結(jié)合的、親和力不理想的適配體就會(huì)被洗脫,而具有高親和力的適配體就能從1016到1018的隨機(jī)文庫中分離出來,且理論上該序列的純度隨著SELEX的不斷篩選將會(huì)越來越高,最后庫中序列大部分都是高親和力序列[2]。這些高親和力序列的結(jié)合具有高特異性,且可選的靶分子廣泛,已經(jīng)在基礎(chǔ)研究、臨床診斷和治療中顯示出了廣闊的應(yīng)用前景。核酸適配體還有著相對(duì)簡單的化學(xué)結(jié)構(gòu),使其易于體外合成和修飾[3],允許在寡核苷酸上的特定位置插入電化學(xué)或熒光報(bào)告分子以及表面結(jié)合劑。
在適配體和靶物質(zhì)結(jié)合過程中,核酸適配體的構(gòu)象變化可以用來產(chǎn)生分析信號(hào)。許多以適配體為基礎(chǔ)的生物傳感器已經(jīng)成功用于測(cè)量蛋白質(zhì)的細(xì)胞分泌,但實(shí)際篩選過程卻不易得到高親和力的序列。在眾多候選的序列中挑選出潛在的高親和力序列,成為了許多適配體研究者的一大困擾。目前通過X光晶體衍射[4]以及核磁共振[5],科學(xué)家們已經(jīng)分析了較多適配體的空間結(jié)構(gòu),并成功解析了許多適配體與靶分子間的作用機(jī)制,這些來之不易的研究成果為后續(xù)各種生物信息學(xué)工具奠定了基礎(chǔ)。
與此同時(shí),隨著計(jì)算機(jī)和信息技術(shù)高速發(fā)展,已有許多計(jì)算機(jī)輔助天然藥物篩選的例子,同時(shí)也有越來越多的研究者發(fā)現(xiàn)通過計(jì)算機(jī)輔助能提升適配體篩選的效率和提高得到高親和力序列的概率,該技術(shù)可能對(duì)適配體未來的發(fā)展產(chǎn)生巨大的影響。本文將著重對(duì)計(jì)算機(jī)輔助適配體篩選相關(guān)方法以及它們的主要應(yīng)用和相關(guān)結(jié)果進(jìn)行分析,同時(shí)對(duì)它們的優(yōu)缺點(diǎn)進(jìn)行比較,并對(duì)近年來該領(lǐng)域的一些創(chuàng)新應(yīng)用進(jìn)行綜述。
1SELEX技術(shù)目前存在的缺陷和發(fā)展
1.1SELEX技術(shù)目前存在的缺陷
1.1.1需要極大的初始文庫容量核酸適配體篩選初始文庫的隨機(jī)序列一般有30–60個(gè)堿基。因此理論上初始文庫容量為 1018–1036,但因目前核酸合成的最大庫容量只能達(dá)到1016,實(shí)際與理論庫容量相比相差很大[6]。
1.1.2篩選流程較為繁瑣整個(gè)篩選流程耗時(shí)長、精力投入大,且無法確定具體篩選的次數(shù),一般需要十幾輪篩選才能夠篩選出親和力較好的序列,武漢大學(xué)基礎(chǔ)醫(yī)學(xué)院的章曉聯(lián)團(tuán)隊(duì)總共進(jìn)行了17輪篩選,才得到了鳥分枝桿菌的適配體[7]。
1.1.3難以篩選出親和力較高的序列正如Kanagawa所指出的,核酸適配體結(jié)構(gòu)越復(fù)雜,其與靶標(biāo)結(jié)合的親和力越高,但由于PCR具有偏好性等原因[8],導(dǎo)致一些富含GC堿基的序列更容易被擴(kuò)增,使原本豐度不夠大的文庫結(jié)構(gòu)變得更加單一,導(dǎo)致某些高親和力的序列在庫中的含量越來越低,造成篩選次數(shù)增加,親和力反而下降的現(xiàn)象。
1.1.4后期處理工作十分復(fù)雜且易錯(cuò)過高親和力序列在測(cè)序、分析、篩選出合適的序列后,還需要再將其合成進(jìn)行重復(fù)驗(yàn)證。如果要鑒定更多序列,不僅成本高,還需要投入大量時(shí)間。所以考慮到成本問題,大多數(shù)情況下還只能合成極少量的序列,因此很容易錯(cuò)過真正有親和力的序列。
1.2SELEX技術(shù)的發(fā)展
針對(duì)以上幾個(gè)問題,2004年Mendonsa等提出了毛細(xì)管電泳SELEX這項(xiàng)技術(shù),因其無需固定相和洗脫的緣故,大大減少了篩選的次數(shù)[9]。
隨后也誕生了無需對(duì)靶物質(zhì)進(jìn)行詳盡分析并且能夠發(fā)現(xiàn)更多潛在靶點(diǎn)的細(xì)胞SELEX技術(shù);還有無需Sanger測(cè)序分析,能在所有篩選輪中對(duì)庫進(jìn)行排序的高通量SELEX(Highthroughputsystematicevolutionofligandsbyexponentialenrichment,HT-SELEX)[10]。HT-SELEX不僅減少了篩選次數(shù),有效地降低了PCR偏好性帶來的誤差,還能完全自動(dòng)化操作,提高了篩選效率,甚至有望取代常規(guī)的SELEX。該技術(shù)如此快速的發(fā)展,離不開計(jì)算機(jī)的輔助:通過強(qiáng)大的生物信息學(xué)工具,對(duì)大量數(shù)據(jù)進(jìn)行全面的分析,并對(duì)結(jié)合能力以及結(jié)構(gòu)進(jìn)行預(yù)測(cè),再量化豐度,模擬適配體與靶物質(zhì)的相互作用,進(jìn)一步綜合分析得到的適配體,盡可能地保留有價(jià)值的序列。
2計(jì)算機(jī)輔助篩選適配體的方法與工具
目前越來越多的生物信息學(xué)工具開始在生物學(xué)研究上嶄露頭角,它們推動(dòng)了核酸適配體的研究,使得研究者們能夠在進(jìn)行生物活性篩選之前,利用計(jì)算機(jī)對(duì)所需的環(huán)境進(jìn)行模擬,得到靶分子和配體在該環(huán)境下最有可能的結(jié)構(gòu),再利用分子對(duì)接軟件模擬目標(biāo)靶點(diǎn)與候選分子之間的相互作用,計(jì)算其結(jié)合能并評(píng)估結(jié)合程度,以此來篩選出高親和力的適配體。且經(jīng)過不斷的研究和改良,已經(jīng)可以通過設(shè)計(jì)算法程序?qū)T-SELEX產(chǎn)生的大量序列進(jìn)行打分,評(píng)價(jià)其富集的程度以及結(jié)合的潛力,再折疊出其中的高分序列最有可能形成的二級(jí)結(jié)構(gòu),利用多種軟件預(yù)測(cè)該高分序列的三級(jí)結(jié)構(gòu),用于之后的對(duì)接驗(yàn)證。下面將主要介紹如何通過計(jì)算機(jī)評(píng)估序列、分析適配體結(jié)構(gòu)和分子對(duì)接的方法輔助適配體的篩選。
2.1通過評(píng)估序列輔助篩選
核酸適配體能夠識(shí)別特異的靶物質(zhì),很大程度上是因?yàn)槠洫?dú)特的三維結(jié)構(gòu)。序列本身的堿基排列順序就能夠?qū)罄m(xù)的三級(jí)結(jié)構(gòu)的折疊產(chǎn)生巨大影響,可能僅僅幾個(gè)堿基的不同適配體三級(jí)結(jié)構(gòu)就會(huì)有很大的差異,導(dǎo)致親和力會(huì)有很大的不同。高親和力適配體的堿基排序必然具有一定的特殊性。為了更好地了解某些特殊結(jié)構(gòu)與序列的關(guān)系,科學(xué)家們也開始把核酸適配體相關(guān)的常見模體(例如G-四聯(lián)體[11]、發(fā)夾、莖環(huán))收錄進(jìn)數(shù)據(jù)庫中,方便后續(xù)利用計(jì)算機(jī)分析這些特異的結(jié)構(gòu)與序列之間存在的規(guī)律。
例如,2000年KensakuSakamoto團(tuán)隊(duì)[12]開發(fā)了針對(duì)發(fā)夾的算法,隨后Gorodkin設(shè)計(jì)了能夠分析RNA序列中的莖環(huán)結(jié)構(gòu)的Stem-LoopAlignSearcH[13]。此后,由于發(fā)現(xiàn)四聯(lián)體在重要的生理過程中不可或缺并且在作為治療靶標(biāo)的應(yīng)用也有著非常重要的作用,使得它受到了廣泛的關(guān)注。為了進(jìn)一步研究四聯(lián)體的序列的特點(diǎn),Kikin等[14]在2006年用PHP編寫了基于Web的程序QGRSMapper(http://bioinformatics.ramapo.edu/QGRS/),該web可用于預(yù)測(cè)核苷酸序列中形成四聯(lián)體的富含鳥嘌呤的序列。
后來也有不少團(tuán)隊(duì)利用QGRSMapper來研究具有四聯(lián)體結(jié)構(gòu)的核酸適配體。例如,為了獲得血管內(nèi)皮生長因子的高親和力適配體,KazunoriIkebukuro[15]團(tuán)隊(duì)利用QGRSMapper分析了它們篩選出適配體Vap7中可能存在的四聯(lián)體結(jié)構(gòu),并利用圓二色譜法驗(yàn)證了該序列中穩(wěn)定的四聯(lián)體結(jié)構(gòu),最后通過優(yōu)化四聯(lián)體的結(jié)構(gòu)成功得到了親和力更高的適配體。Zheng等[16]也通過QGRSMapper分析了石房蛤毒素的適配體,發(fā)現(xiàn)該適配體也存在穩(wěn)定的四聯(lián)體結(jié)構(gòu),篩選出了四聯(lián)體結(jié)構(gòu)最為穩(wěn)定的適配體,之后通過保留四聯(lián)體相關(guān)的序列,截短多余的序列,成功得到了STX的高親和力適配體。
它們雖然較好地分析出了序列中某種特殊模體的穩(wěn)定性和可能性,能夠在序列數(shù)量不多的情況下篩選出分?jǐn)?shù)最高即最能夠穩(wěn)定形成上述特定結(jié)構(gòu)的序列,但是它們只能針對(duì)一種特定的特殊模體進(jìn)行分析,不能夠分析序列中存在多種特殊模體的可能性。這就需要我們對(duì)適配體與靶物質(zhì)的作用模體有一定的了解,才能夠保證高效無誤地篩選出具有親和力的適配體。且這類早期的算法只能輸入較少的序列,因此很難應(yīng)用到大量數(shù)據(jù)的處理上。所以,為了能夠分析類似于HT-SELEX產(chǎn)生的大量且無序的數(shù)據(jù),就需要設(shè)計(jì)新的算法對(duì)這些序列進(jìn)行多次的聚類和分類[17]。
3計(jì)算機(jī)在適配體上的創(chuàng)新應(yīng)用
隨著計(jì)算機(jī)在適配體上的應(yīng)用逐步推廣,以及計(jì)算機(jī)科學(xué)技術(shù)的飛速發(fā)展,人工智能逐步興起,目前已有研究者將機(jī)器學(xué)習(xí)應(yīng)用到了SELEX上。在2020年新冠病毒爆發(fā)的這段時(shí)間里,廈門大學(xué)楊朝勇教授為了從大量序列數(shù)據(jù)中得到高性能的刺突蛋白適配體。設(shè)計(jì)開發(fā)了一款新的序列多維分析算法SMART-Aptamer,通過無監(jiān)督機(jī)器學(xué)習(xí)過程,來識(shí)別適配體家族并跟蹤適配體家族大小的動(dòng)態(tài)變化。
以SARS-CoV-2的刺突蛋白作為研究對(duì)象,為了篩選出能夠具有中和作用的S蛋白適配體,在原本的正篩選和反篩選的基礎(chǔ)上,額外的考慮了與ACE2的競(jìng)爭作用,更重要的是在該過程中使用了SMART-Aptamer,該算法考慮到了ACE2競(jìng)爭壓力,成功地利用了可變選擇壓力研究了其進(jìn)化譜系。最后成功得到了高親和力的適配體CoV2-RBD-1和CoV2-RBD-4[41]。
該類適配體為SARS-CoV-2的診斷和治療提供新的思路,同時(shí)也為深入研究冠狀病毒感染的機(jī)制提供了新的工具。計(jì)算機(jī)不僅能夠應(yīng)用到SELEX的流程中,還能夠應(yīng)用在初始文庫的設(shè)計(jì)上。由于初始文庫是核酸適配體篩選的源頭,作為SELEX中最重要的一環(huán),如果設(shè)計(jì)不合理,必然會(huì)影響到篩選的結(jié)果[42]。因此越來越多的研究者開始重視初始文庫的設(shè)計(jì),開始利用計(jì)算機(jī)設(shè)計(jì)初始文庫。
例如,在已知某二級(jí)結(jié)構(gòu)與適配體的親和力密切相關(guān)時(shí),就可在核酸適配體數(shù)據(jù)庫中[43]挑選目前已知的核酸適配體,再利用二級(jí)結(jié)構(gòu)的預(yù)測(cè)軟件諸如Mfold等[44]對(duì)挑選出的序列進(jìn)行預(yù)測(cè),由此從龐大的數(shù)據(jù)庫中篩選出具有該特殊結(jié)構(gòu)的適配體,構(gòu)建出一個(gè)新的初始文庫,不僅定向增加了含有該結(jié)構(gòu)的適配體,還可保留天然適配體中的高級(jí)結(jié)構(gòu)。Luo等[45]利用相同的思路,對(duì)隨機(jī)文庫中的結(jié)節(jié)進(jìn)行統(tǒng)計(jì),并對(duì)非引物部分進(jìn)行隨機(jī)突變來增加文庫豐富程度,最后獲得的RFPoolA文庫,經(jīng)過驗(yàn)證,相較于普通的隨機(jī)文庫,其高級(jí)結(jié)節(jié)的結(jié)構(gòu)含量有明顯增加。
2016年,Xu等[46]對(duì)已有的前列腺特異性膜抗原適配體進(jìn)行二級(jí)結(jié)構(gòu)的預(yù)測(cè),再通過分子對(duì)接軟件綜合比較確定了其作用的關(guān)鍵結(jié)構(gòu),然后在此結(jié)構(gòu)的基礎(chǔ)上,對(duì)已有的核酸適配體進(jìn)行單點(diǎn)突變、截?cái)嘁约安迦,通過該方法得到了一個(gè)新的文庫,最后利用三維結(jié)構(gòu)預(yù)測(cè)軟件Vfold3D[47]進(jìn)行結(jié)構(gòu)預(yù)測(cè)。通過分子對(duì)接進(jìn)行親和力的驗(yàn)證,最終成功獲得了親和力更高且較短序列的適配體。由此表明,分子模擬技術(shù)應(yīng)用于初始文庫的設(shè)計(jì),確實(shí)對(duì)于提高適配體親和力以及篩選效率有明顯的效果和應(yīng)用潛力。
計(jì)算機(jī)論文范例: 高職院校計(jì)算機(jī)專業(yè)學(xué)生創(chuàng)新創(chuàng)業(yè)教育模式探索
4總結(jié)與展望
有著巨大潛力的計(jì)算機(jī)技術(shù)為適配體的研究帶來了福音,不同種類的分析軟件和分子模擬軟件給研究人員提供了十分有價(jià)值的信息,解決了部分SELEX技術(shù)的問題。例如,通過計(jì)算機(jī)設(shè)計(jì)文庫,在SELEX開始之前就有目的地富集所需的特殊結(jié)構(gòu)的序列,從根本上提高SELEX技術(shù)的效率,也在一定程度上解決了SELEX篩選出的核酸適配體結(jié)構(gòu)簡單不具有高級(jí)結(jié)構(gòu)的問題。
利用打分軟件有預(yù)見性地對(duì)次級(jí)文庫中序列進(jìn)行評(píng)估,可以先篩選出一些具有高級(jí)結(jié)構(gòu)和穩(wěn)定結(jié)構(gòu)的核酸適配體;再使用適配體結(jié)構(gòu)預(yù)測(cè)軟件,對(duì)那些難以得到結(jié)構(gòu)的適配體進(jìn)行模擬,也一定程度上減輕了研究適配體結(jié)構(gòu)的困難;最后可以在分子模擬平臺(tái)上進(jìn)行對(duì)接驗(yàn)證,由此在進(jìn)行大量親和力實(shí)驗(yàn)前,便可有方向性地得到一些“高親和力序列”,一定程度上降低了實(shí)驗(yàn)室只合成低親和力的序列用于驗(yàn)證最后導(dǎo)致篩選失敗的可能,也大大減少了SELEX篩選的輪數(shù),提升了篩選的效率。
REFERENCES
[1]TuerkC,GoldL.Systematicevolutionofligandsbyexponentialenrichment:RNAligandstobacteriophageT4DNApolymerase.Science,1990,249(4968):505-510.
[2]DjordjevicM.SELEXexperiments:newprospects,applicationsanddataanalysisininferringregulatorypathways.BiomolEng,2007,24(2):179-189.
[3]周成林,許化溪.SELEX技術(shù)及Aptamer在小分子中的應(yīng)用進(jìn)展.中國國境衛(wèi)生檢疫雜志,2011,34(4):276-279,288.ZhouCL,XuHX.TheapplicationdevelopmentofSELEXandAptamerinmicromolecules.ChinJFrontHealQuar,2011,34(4):276-279,288(inChinese).
[4]RuigrokVJ,LevissonM,HekelaarJ,etal.Characterizationofaptamer-proteincomplexesbyX-raycrystallographyandalternativeapproaches.IntJMolSci,2012,13(8):10537-10552.
作者:鄧博文,高思懿,肖博懿,吳雨龍,孫豪,王梁華,孫銘娟
轉(zhuǎn)載請(qǐng)注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///dzlw/27765.html