本文摘要:摘要高等植物的葉綠體基因組主要遺傳自母本,具有基因組
摘要高等植物的葉綠體基因組主要遺傳自母本,具有基因組小、結(jié)構(gòu)簡單、序列高度保守等特點。利用系統(tǒng)的生物信息學方法,對4種藜屬植物的葉綠體基因組進行了編碼基因組成、基因組結(jié)構(gòu)、重復(fù)序列、變異位點在內(nèi)的比較基因組學研究,以及基于葉綠體基因組序列的藜亞科植物的系統(tǒng)進化研究。結(jié)果表明,4種藜屬植物葉綠體基因組平均大小151936bp,平均GC含量為37.16%,具體基因的拷貝數(shù)和總的基因數(shù)目差異很小,非常保守。除灰綠藜以外,其余3種藜屬植物葉綠體基因組的LSC、SSC和IR區(qū)域的邊界幾乎完全一致,沒有表現(xiàn)出明顯的擴張與收縮。基因組的重復(fù)序列中,相較于SSR,長重復(fù)序列片段的比例更高。相比較IR區(qū)域,4種藜屬植物的LSC和SSC區(qū)域之間存在更大的核苷酸位點差異;52~59kb的基因組區(qū)域為4種藜屬植物間核苷酸位點變異最大的區(qū)段;谌蚪M和LSC+SSC序列,分別構(gòu)建了包括4種藜屬植物在內(nèi)的藜亞科植物的系統(tǒng)進化樹,進化關(guān)系完全一致。本研究結(jié)果揭示了藜屬植物葉綠體基因組的進化特征,可為藜屬植物系統(tǒng)進化研究提供優(yōu)良的候選分子標記。
關(guān)鍵詞藜屬;葉綠體基因組;變異位點;重復(fù)序列;系統(tǒng)進化
高等植物中,葉綠體基因組主要遺傳自母本材料,具有基因組小、基因組結(jié)構(gòu)簡單且保守、組成核酸序列和編碼基因變異小等特點[1]。高等植物的葉綠體基因組主要由4個獨立的區(qū)域構(gòu)成,包括一個大單拷貝區(qū)域(largesingle-copy,LSC),一個小單拷貝區(qū)域(smallsingle-copy,SSC),以及兩個分開的反向重復(fù)區(qū)域(invertedrepeata/b,IRa/b)。因為葉綠體基因組很小,保守的基因組序列和基因組成的特點,其非常適合用于復(fù)雜的植物群系進行系統(tǒng)進化研究[1-3]。
藜屬植物(Chenopodium)分類學上屬于藜亞科(Chenopodioideae)一年生草本植物,其籽粒可用作糧食。在公元前5000年左右的南美洲,藜屬的藜麥(Chenopodiumquinoa)被當?shù)赝林用褡鳛橹骷Z,被稱為“糧食之母”。20世紀70年代,藜麥被美國航空航天局選為太空主食。2013年,聯(lián)合國糧農(nóng)組織冠名該年份為“國際藜麥年”,以突出藜麥的重要性。目前,主流觀點認為藜麥是一種全營養(yǎng)食物,可以滿足人類日常的大部分營養(yǎng)需求[4-7]。同時,藜麥還具有優(yōu)良的抗逆性,作為主糧作物開始在全世界范圍展開種植[8-9]。2019年,聯(lián)合國糧農(nóng)組織統(tǒng)計數(shù)據(jù)顯示全世界共種植184585公頃,年產(chǎn)量161415噸(www.fao.org/statistics)。此外,研究表明藜屬的其它物種也富含高價值的營養(yǎng)物質(zhì)[10-13]和良好的抗逆性[14]。近年來藜屬植物的研究在全球范圍內(nèi)廣泛開展,包括種子營養(yǎng)價值、抗逆性評估和育種推廣等方面。
截止2021年1月18號,NCBI的葉綠體基因組數(shù)據(jù)庫中共有4,650個高等植物的測序記錄(www.ncbi.nlm.nih.gov/genome),葉綠體基因組大小平均值為152.08kb,GC含量平均值為37.44%,平均分布83個蛋白編碼基因。Asarumminus(NC_037503.1)的基因組最小,只有15.55kb,GC含量32.28%,分布著7個蛋白編碼基因。Pelargoniumtransvaalense(NC_031206.1)的基因組最大,有242.58kb,39.89%的GC含量,分布著132個蛋白編碼基因。目前,藜屬植物中已有包括.album(灰藜)、.ficifolium(小葉藜)、.glaucum(灰綠藜)、.quinoa(藜麥)在內(nèi)的4個物種的葉綠體基因組完成測序。本研究基于系統(tǒng)的比較基因組學研究方法,對4種藜屬植物的葉綠體基因組進行了編碼基因組成,LSC、SSC和IR區(qū)域邊界比較,SSR和長重復(fù)序列挖掘和基因組范圍內(nèi)的變異熱點區(qū)域鑒定的研究;谌蚪M和LSC+SSC序列,構(gòu)建了包括4種藜屬植物在內(nèi)的藜亞科植物的系統(tǒng)進化樹。本研究結(jié)果闡明了藜屬植物葉綠體基因組序列特征和進化特點,可為更為廣泛的藜屬植物的系統(tǒng)進化提供優(yōu)良的候選分子標記序列。
1材料與方法
1.1藜屬植物葉綠體基因組序列從NCBI的基因組數(shù)據(jù)庫(www.ncbi.nlm.nih.gov\genome)下載了4種藜屬植物的葉綠體基因組序列,具體物種信息和序列編號如下:C.album(灰藜,編號:NC_034950.1),.ficifolium(小葉藜,編號:NC_041200.1),.glaucum(灰綠藜,編號:MN422308)和.quinoa(藜麥,編號:NC_034949.1)。
1.2藜屬植物葉綠體基因組序列組成和編碼基因利用Mummer3.0[15]將4種藜屬植物葉綠體基因組序列,分別和各自的葉綠體基因組序列進行兩兩比對,確定LSC、SSC和IR區(qū)域的邊界;谡n題組編寫的Python腳本,對4種藜屬植物葉綠體基因組的基因組大小,GC含量,LSC、SSC、IR區(qū)域大小,總的基因數(shù)目,基因的拷貝數(shù)進行統(tǒng)計和可視化。
1.3藜屬植物葉綠體基因組LSC、SSC和IR邊界差異基于Mummer3.0[15]的比對結(jié)果,利用Perl語言的SVG模塊,分別進行了4種藜屬植物葉綠體基因組的LSC、SSC和IR區(qū)域邊界的可視化,包括LSC、SSC和IR區(qū)域大小的擴張與收縮,定位在邊界上的基因差異。
1.4藜屬植物葉綠體基因組重復(fù)序列和變異位點的挖掘利用Perl語言編寫的腳本MISA,進行了葉綠體基因組序列中重復(fù)單元為1~6堿基的SSR(SimpleSequenceRepeat)序列的檢測。利用REPuter[16]進行了葉綠體基因組序列中長片段重復(fù)序列的檢測。具體參數(shù)設(shè)置為:檢測正向、反向、互補、回文4種類型;最短重復(fù)單元至少包含30bp;最大檢測重復(fù)序列數(shù)目為1000;重復(fù)序列相似性至少為90%。利用MAFFT[17]軟件進行了葉綠體基因組序列的比對;基于比對結(jié)果,利用DnaSP6[18]進行了變異位點的挖掘和可視化,參數(shù)默認設(shè)置。
1.5基于葉綠體基因組的藜亞科植物的系統(tǒng)進化樹構(gòu)建從NCBI的基因組數(shù)據(jù)庫(www.ncbi.nlm.nih.gov\genome)下載了另外的12種藜亞科植物的葉綠體基因組序列,具體物種信息和序列編號如下:Spinaciaoleracea(NC_002202.1),Dysphaniabotrys(NC_042166.1),.pumilio(NC_041159.1),.ambrosioides(NC_041201.1),Salicorniabigelovii(NC_027226.1),.europaea(NC_027225.1),Haloxylonammodendron(NC_027668.1),.persicum(NC_027669.1),Suaedamalacosperma(NC_039180.1),.japonica(NC_042675.1),.salsa(NC_045302.1),和.glauca(NC_045303.1)。以Dianthuscaryophyllus作為外群,基于包括藜屬植物在內(nèi)的16種藜亞科植物的葉綠體全基因組序列,利用MAFFT軟件[17]進行了基因組序列的比對;比對結(jié)果經(jīng)過trimAl軟件[19]進一步優(yōu)化處理,調(diào)整比對結(jié)果;趦(yōu)化后的比對結(jié)果,利用IQ-TREE1.6.12[20],構(gòu)建了藜亞科植物的ML(maximumlikelihood)系統(tǒng)進化樹,Bootstrap值設(shè)置為1000,建樹最優(yōu)模塊由IQ-TREE內(nèi)置的ModelFinder[21]進行選擇。
2結(jié)果
2.1藜屬植物的葉綠體基因組
從NCBI的Genome數(shù)據(jù)庫中一共下載了4種藜屬植物.album、.ficifolium、.glaucum、.quinoa的葉綠體基因組,對其葉綠體基因組序列和編碼基因的進行了統(tǒng)計和比較。
2.2藜屬植物葉綠體基因組的編碼基因
藜屬植物的葉綠體基因組的編碼基因主要包括三大方面:①Self-replication、②Genesforphotosynthesis和③Othergenes。統(tǒng)計表明,非編碼RNA和蛋白編碼基因在藜屬植物中存在著雙拷貝基因。比如:rRNA基因rrn16,rrn23,rrn4.5,rrn5;tRNA基因trnAUGC,trnICAU,trnIGAU,trnLCAA,trnNGUU,trnRACG;small/largesubunitofribosome編碼基因rps7,rps12和rpl2;蛋白編碼基因ndhB、ycf1、ycf2。此外,非編碼RNA和蛋白編碼基因在不同藜麥物種之間還存在著拷貝數(shù)目的差異和物種特異性的丟失。trnGUCC在.quinoa中丟失;trnfMCAU在C.quinoa只存在一個拷貝,在其余三種物種中都丟失了;trnMCAU在C.quinoa中只存在一個拷貝,在另外三個物種中卻存在兩個拷貝。
2.3藜屬植物葉綠體基因組LSC、SSC和IR之間的邊界擴張與基因重排我們進行了4個藜屬物種葉綠體基因組LSC、SSC和IR邊界的擴張與基因重排比較。
4個藜屬物種的每個基因組都包含完整LSC區(qū)域(83,579bp~83,676bp)、SSC區(qū)域(17,892bp~18,107bp)和兩者之間的IR區(qū)域(25,092bp~25,205bp)。4個藜屬物種之間,LSC、SSC和IR區(qū)域沒有顯示出明顯的擴張或者收縮,顯示出屬內(nèi)植物的葉綠體基因組結(jié)構(gòu)的高度保守性。此外,對4個藜屬物種的LSC、SSC和IR之間的邊界進行了可視化和比較。結(jié)果表明,.album、.ficifolium、.quinoa三個物種的在LSC、SSC和IR之間邊界處的基因分布位置和基因長度幾乎完全一致。相比較上述三個物種,.glaucum葉綠體基因組的LSC/IRb邊界處基因分布存在一定的基因重排。rps19基因分布在正鏈,靠IRb區(qū)域一側(cè);rpl22則出現(xiàn)在了負鏈,靠LSC區(qū)域一側(cè)。
2.4藜屬植物葉綠體基因組的重復(fù)序列
利用MISA程序進行了藜屬植物葉綠體基因組中SSR序列的檢測,結(jié)果如表3所示。在4個物種葉綠體基因組中只發(fā)現(xiàn)了重復(fù)基序分別為1、2和3個堿基的SSR序列,其中重復(fù)基序為3個堿基的SSR只在.ficifolium和.glaucum葉綠體基因組中存在。.album、.ficifolium、.glaucum和.quinoa葉綠體基因組中總共分別分布著33、32、49和31處SSR序列,大小分別總計359bp、360bp、539bp和337bp。
4種藜屬植物中SSR的絕大部分為重復(fù)基序為1個堿基的SSR;重復(fù)基序為2和3個堿基的SRR序列數(shù)量非常少。重復(fù)基序為1個堿基的SSR在.album、.ficifolium、.glaucum和.quinoa中分別分布著32、28、45和28個,大小分別總計345、307、484和299bp(表3)。在.album、.ficifolium、.glaucum和.quinoa中,分布在LSC區(qū)域的SSR大大超過了在SSC和IR區(qū)域的數(shù)量,分別分布著21、19、38和17處SSR。此外,4個物種葉綠體基因組中分布在基因間區(qū)域的SSR也遠超在基因編碼區(qū)域的數(shù)量。
3討論與結(jié)論
目前,高等植物物種親緣關(guān)系的聚類分析,主要基于細胞核和細胞器(葉綠體、線粒體)基因組序列衍生出的包括RAPD(RandomAmplifiedPolymorphicDNA)、SSR和SNP(SingleNucleotidePolymorphism)在內(nèi)的多種分子標記。葉綠體基因組在同屬乃至同科植物中,其基因組大小、編碼基因都顯現(xiàn)出高度的保守性,包括本研究的Chenopodium、以及Aster[22]、Fritillaria[23]、Lilium[23]等屬植物;同時,葉綠體基因組存在一定的核苷酸位點變異,非常適合進行近緣同屬、同科植物的系統(tǒng)進化分析。本研究發(fā)現(xiàn)4種藜屬植物葉綠體基因組LSC和SSC區(qū)域的核苷酸序列存在豐富的變異位點。我們將藜亞科植物葉綠體基因組的LSC和SSC區(qū)域單獨提取出來,進行系統(tǒng)進化樹的構(gòu)建(.caryophyllus作為外群),獲得了和全基因組序列構(gòu)建的系統(tǒng)進化樹一致的親緣關(guān)系結(jié)果,且分支的支持率都達到了100。
表明藜亞科植物的LSC和SSC區(qū)域豐富的核苷酸變異位點完全可以進行精確的藜亞科植物的系統(tǒng)進化分析。錦葵科(Malvaceae)木槿屬(Hibiscus)的大麻槿(.cannabinus)、木槿(.syriacus)在傳統(tǒng)分類學上被認為具有最為相近的親緣關(guān)系,但是,基于葉綠體全基因組序列的錦葵科植物的系統(tǒng)進化樹表明[24]:大麻槿(.cannabinus)與Taliparitihamabo、Abelmoschusesculentus有著更近的親緣關(guān)系;而不是木槿(.syriacus)。
兩者之間的葉綠體基因組比對發(fā)現(xiàn):在SSC區(qū)域存在著一個23kb左右的核苷酸高變異區(qū)域;該區(qū)域編碼了15個蛋白編碼基因,2個rRNA和4個tRNA。傘形科(Apiaceae)羌活屬(Notopterygium)是我們國家特有的瀕危多年生植物。寬葉羌活(.franchetii)、卵葉羌活(.oviforme)、羌活(.incisum)、瀾滄羌活(.forrestii)的葉綠體基因組研究表明[25]:基因組之間核苷酸位點的差異主要集中在非編碼區(qū)域;在LSC、SSC和IR區(qū)域都發(fā)現(xiàn)了高變異的核苷酸位點,其中SSC的變異位點最為富集。
基于葉綠體全基因組和LSC+SSC區(qū)域構(gòu)建的14種傘形科植物(包括上述4種羌活屬植物在內(nèi))的系統(tǒng)進化樹呈現(xiàn)出一致的親緣關(guān)系結(jié)果。目前,隨著高通量測序技術(shù)的發(fā)展和測序成本的降低,高等植物葉綠體基因組序列逐漸被解析;同時,仍然有大量的高等植物葉綠體基因組還沒有完成測序。那么,基于近緣同屬或者同科物種的葉綠體基因組的多序列比對,挖掘出核苷酸變異的區(qū)域,進行這些候選分子標記區(qū)域的擴增和測序。聯(lián)合多個測序擴增片段中的核苷酸多態(tài)性,進行系統(tǒng)進化樹的構(gòu)建,實現(xiàn)同科或同屬的植物的系統(tǒng)進化分析。相比較于葉綠體基因組測序,基于近緣物種的分子標記的挖掘和后續(xù)的PCR擴增,該研究策略的試驗成本大為降低,目前已經(jīng)取得了不錯的研究成果。
在獼猴桃研究中,Tang等人[26]對9個獼猴桃種的葉綠體基因組進行了全基因組范圍內(nèi)的差異位點的挖掘,鑒定得到24個高變異的基因間區(qū)域;基于其中4個區(qū)域(ndhF-rps32、ndhC-trnV(UAC)、rps16-trnQ(UUG)和trnE(UUC)-trnT(GGU))的擴增結(jié)果,對46個不同獼猴桃種進行了親緣關(guān)系的系統(tǒng)進化分析,物種的聚類結(jié)果和基于核基因組SNP的聚類結(jié)果[27]大體上一致。同時,相比較之前的基于單基因序列的建樹結(jié)果[28],該研究結(jié)果和基于核基因組SNP的聚類結(jié)果進一步證明了自然界中獼猴桃物種之間存在相互雜交導(dǎo)致的種間網(wǎng)狀進化關(guān)系。
植物種植論文范例:植物精油在糧油食品抑菌中的應(yīng)用
本研究4種藜屬植物的LSC和SSC區(qū)域豐富的核苷酸變異位點,尤其是52~59kb區(qū)域變異最大的基因組片段,可以作為候選的分子標記進行開發(fā),在更大范圍的藜屬或藜科植物材料中進行系統(tǒng)進化分析。本研究結(jié)果表明,4種藜屬植物葉綠體基因組平均大小151,936bp,平均GC含量為37.16%。相比較SSR,基因組序列的重復(fù)序列主要為長重復(fù)序列片段。藜屬植物的LSC和SSC區(qū)域的核酸序列相比較IR區(qū)域顯現(xiàn)出更大的變異;在52~59kb區(qū)域含有4種藜屬植物變異最大的核酸片段。同時,灰綠藜在全基因范圍顯示出和其它三個藜屬植物存在較大的位點差異。包括4種藜屬植物的藜亞科植物的系統(tǒng)進化樹表明:藜屬的4個物種和Spinacia、Dysphania兩個屬的物種親緣關(guān)系較近;同時,進一步支持灰綠藜和其它三個藜麥屬物種存在相對較遠的親緣關(guān)系。
參考文獻[References]
1DaniellH,LinCS,YuM,ChangWJ.Chloroplastgenomes:diversity,evolution,andapplicationsingeneticengineering[J].GenomeBiol2016,17(1):134
2JansenRK,CaiZ,RaubesonLA,DaniellH,DepamphilisCW,Leebens-MackJ,MullerKF,Guisinger-BellianM,HaberleRC,HansenAK,ChumleyTW,LeeS-B,PeeryR,McNealJR,KuehlJV,BooreJL.Analysisof81genesfrom64plastidgenomesresolvesrelationshipsinangiospermsandidentifiesgenome-scaleevolutionarypatterns[J].PNatlAcadSciUSA2007,104(49):19369-19374
3CuiYX,ChenXL,NieLP,SunW,HuHY,LinYL,LiHT,ZhengXL,SongJY,YaoH.ComparisonandPhylogeneticAnalysisofChloroplastGenomesofThreeMedicinalandEdibleAmomumSpecies[J].IntJMolSci2019,20(16):4040
4YangXS,ZhuKL,GuoHM,GengYL,LvW,WangSY,GuoYQ,QinPY,RenGX.CharacterizationofvolatilecompoundsindifferentlycolouredChenopodiumquinoaseedsbeforeandaftercookingbyheadspace-gaschromatography-ionmobilityspectrometry[J].FoodChem2021,348:129086
作者:蔣禮玲1**王琳超2黃新榮1楊宇若2王明雪1,4賈舉慶3黃勝雄
轉(zhuǎn)載請注明來自發(fā)表學術(shù)論文網(wǎng):http:///nylw/27622.html