時間:2021年07月30日 分類:農業論文 次數:
摘要為全面了解白樺類甜蛋白(thaumatin-likeprotein,TLP)基因家族成員的結構、功能和表達特性,本研究采用同源序列比對法,從白樺基因組數據庫中篩選并鑒定到41個類甜蛋白基因家族成員,分別命名為BpTLP1~BpTLP41,對其進行生物信息學分析,并通過半定量對白樺TLP家族成員的組織表達特異性進行了分析。結果表明,41個白樺類甜蛋白家族成員分別定位在11條染色體上,其中8號染色體分布最多,包括14個家族成員。該家族成員的氨基酸數量在336~975aa之間,分子量在28054.11~81966.03kDa之間,理論等電點在5.01~5.21之間,偏酸性。基因半定量結果表明,41個白樺TLP家族成員在根、莖、葉中均有不同程度的表達,其中,BpTLP35、BpTLP39在葉片中表達量較高,BpTLP14、BpTLP35、BpTLP36在莖中表達量較高,BpTLP41、BpTLP3在根中表達量較高。
關鍵詞白樺;類甜蛋白;生物信息學;組織表達
植物在生長過程中會受到多種不良外界環境的影響,在長期的進化過程中,植物形成了多種防御機制來響應不良環境的脅迫。當植物受到病原菌的侵害時,會合成木質素(Staskawiczetal.,1995)、植保素(Stevensonetal.,1997)、酚類物質(ReimersandLeach,1991;周潔等,1997)、防御酶系(郭澤建和李德葆,2000;黃秀麗,2009)及抗病蛋白質等物質來提高自身的抗病性。
生物信息工程評職知識:sci收錄的遺傳學與生物信息學領域期刊
病程相關蛋白(pathogenesisrelatedprotein,PR)是植物受病原菌侵染或一些特定化合物刺激后產生的蛋白質,與系統獲得性抗性(systemicacquiredresistance,SAR)和過敏性壞死反應(hypersensitiveresponse,HR)密切相關,是防衛反應基因編碼的主要產物之一,不同植物中均有該類蛋白的存在(張青等,2018)。以氨基酸序列的同源性及結構特點為準,可將PR蛋白分為17個家族(王晶等,2011),其中第5家族(PR5)是一類可溶性強、具有抗真菌活性的蛋白,主要包括類甜蛋白(thaumatin-likeprotein,TLP)、滲調蛋白(osmotin)和滲透蛋白(permeatins)(Dafoeetal.,2010)。類甜蛋白在植物防御反應中具有重要作用,與甜蛋白氨基酸同源性較高,但因其無甜味,但具有抗真菌活性,故被稱為類甜蛋白(vanderWelandLoeve,1972)。
TLP對不同類型的病原菌生長均有抑制作用,它能與病原菌細胞膜結合,形成離子通道,進而改變膜的通透性,致使病原菌死亡(馮超,2011)。其抗真菌活性的應用如下,過度表達能夠誘導不同轉基因植物的抗真菌活性,如在過度表達煙草TLP基因的轉基因馬鈴薯植株中發現其抗真菌活性增強(韓德平,2013;Zhangetal.,2018)。
TLP由3個結構域組成,包括域Ⅰ、域Ⅱ和域Ⅲ。大多數TLP含有16個半胱氨酸殘基,能夠形成8個二硫鍵,分布在TLP的3個結構域中,同時在域I和域II之間觀察到一個域間的分裂。TLP的高酸性結構域間裂縫與其抗真菌和β-葡聚糖酶活性密切相關(Zhangetal.,2018)。β-1,3-葡聚糖是真菌細胞壁的主要成分,葡聚糖酶活性使TLP有效參與病、蟲誘導的植物防御反應過程,并在果實成熟過程中發揮著重要作用(El-kereamyetal.,2011;Hoetal.,2007;Yanetal.,2017)。TLP屬于多基因家族,目前已從擬南芥和水稻基因組的表達序列標簽數據庫中分別得到TLP基因家族成員28個和31個(Liuetal.,2010a;2010b)。本研究采用同源序列比對法,從白樺基因組數據庫中篩選并鑒定到41個TLP基因家族成員,在基因的染色體定位、蛋白質的理化性質、亞細胞定位、保守結構域等方面進行了預測和分析,并對各家族成員的組織表達特異性進行了分析,為進一步研究白樺TLP基因家族的功能提供參考。
1結果與分析
1.1白樺TLP基因家族成員的篩選和鑒定從白樺基因組數據庫中查找TLP家族成員序列信息,通過同源比對及保守結構域分析,最終鑒定出41個白樺TLP基因家族成員,按照所在染色體位置分別命名為BpTLP1~BpTLP41。染色體定位結果表明,41個白樺TLP家族成員分布在11條染色體上,其中以8號染色體最多,分布有14個基因;其次為14號染色體,分布有8個基因。在10、11、12號染色體未發現有白樺TLP基因家族成員分布。
1.2白樺TLP基因家族成員理化性質分析使用ExPASy在線工具ProtParamtool對白樺TLP家族成員進行理化性質分析,結果表明,白樺TLP家族成員的氨基酸數量在336~975aa之間,分子量在28054.11~81966.03kDa之間,理論等電點在5.01~5.21之間,偏酸性。親水性總平均值顯示該家族基因編碼蛋白均為疏水性蛋白。亞細胞定位結果表明,BpTLP34~BpTLP40定位于液泡中,BpTLP5同時定位在細胞質和細胞壁中,BpTLP12同時定位在細胞壁和細胞核中,其余家族成員均定位于細胞質中。
1.3白樺TLP基因家族成員蛋白結構分析使用NCBI中的CDD比對分析,該基因家族成員均含有TLP-PA結構域(圖2),具有此結構域的基因多參與宿主防御真菌等反應過程(陳建梅,2015)。使用TBtools軟件分析保守結構域,結果顯示,所有白樺TLP均含有1~4個Motif。除BpTLP12外,均含有Motif1,除BpTLP5、BpTLP6、BpTLP12、BpTLP13、BpTLP14、BpTLP21以及BpTLP28外,其余都含有Motif2,除BpTLP5、BpTLP6、BpTLP12和BpTLP25外,其余均含有Motif3。除BpTLP5、BpTLP6、BpTLP7、BpTLP17、BpTLP28、BpTLP34、BpTLP35、BpTLP36、BpTLP37、BpTLP38、BpTLP39和BpTLP40外,其余均含有Motif4。以BpTLP1蛋白構型模式圖為例可見,Motif1、Motif2和Motif3均在“V”字型裂縫中,該特征在類甜蛋白中是高度保守的,保證了蛋白催化功能的實現(劉潮等,2017)。
1.4白樺TLP基因家族成員啟動子順式作用元件分析取白樺TLP家族基因ATG上游1500bp區段進行啟動子順式作用元件的分析,結果表明,該家族基因啟動子除含有多個真核啟動子核心序列,如TATA-box、CAAT-box外,還含有多個激素響應元件,如脫落酸(ABRE)、茉莉酸(CGTCA-motif)、水楊酸(TCA-element)響應元件、參與低溫反應(LTR)、防御和脅迫響應(TC-richrepeats)、受傷和真菌激發響應(Wbox)等元件。其中,29個白樺TLP基因家族成員含有脫落酸響應原件,數量從1-8個不等;18個成員含有茉莉酸響應元件,數量從1-4個不等;而水楊酸響應元件只分布在9個家族成員中;所有基因啟動子區均含有多個TATA-box和CAAT-box;10個家庭成員含有參與低溫反應響應元件;14個家族成員含有防御和脅迫響應元件;18個白樺TLP基因家族成員含有受傷和真菌激發響應元件。
1.5白樺TLP基因家族成員系統進化分析為進一步了解白樺TLP基因家族成員的功能及其與模式植物擬南芥同源基因間的進化關系,選取了10個不同分組的擬南芥TLP基因家族成員與白樺41個白樺TLP基因家族成員共同構建系統進化樹(圖5)。結果表明,白樺TLP基因家族成員分組與擬南芥不同,未能分成10個聚類組。其中,BpTLP34~BpTLP41與擬南芥AT4G11650親緣關系較近,而擬南芥AT4G11650與病原或環境脅迫響應密切相關(劉潮等,2018),推測BpTLP34~BpTLP41基因可能具有相似功能。
2討論
本研究通過生物信息學的方法篩選和鑒定得到41個白樺TLP基因家族成員,家族成員數量較多。不同植物基因組所含有的TLP基因家族成員數量差異較大,如擬南芥中含有28個TLP基因家族成員、水稻中含有31個、桃(Prunuspersica)38個、楊樹(Populustrichocarpa)59個、玉米(Zeamays)67個、面包小麥(Triticumaestivum)84個、火炬松(Pinustaeda)87個。
植物TLP家族成員在細胞中的分布較為廣泛,在香蕉(Musaspp.)中,大部分TLP家族成員分布在胞外,少部分分布在液泡中;在莜麥(nakedoats)中,有66.7%定位在胞外,22.2%定位在液泡中(韓德平,2013)。白樺TLP亞細胞定位顯示大部分家族成員定位在細胞質,少部分定位在液泡,與前人研究有較大差異,因此推斷白樺TLP可能主要在細胞質發揮作用。在桑樹中發現所有其所有TLP序列均含有thaumatin結構域(Pfam:PF00314),在楊樹(Populustrichocarpa)的59個TLP基因中,其中有49個TLP含有此結構域(Petreetal.,2011),白樺TLP基因家族中均含有此保守結構域,此結構域逐漸成為TLP基因篩選與鑒定的依據(孫偉博,2018)。
在白樺TLP家族成員氨基酸保守基序的分析中發現,白樺TLP家族成員共含有4個保守基序,分別為motif1、motif2、motif3、motif4,22個家族成員含有全部4個保守基序,并且motif1、motif2、motif3保守基序均在由域Ⅰ、域Ⅱ、域Ⅲ構成的“V”字型裂縫中,此結果與劉潮等(2017)人研究一致,該裂縫中含有酸性氨基酸,使其呈酸性,具有高酸性“V”字型裂縫特征的此家族蛋白具有抗真菌活性(韓德平,2013)。染色體定位發現,多個基因具有集中分布的現象,說明這些基因可能是在基因復制過程中進化而來。
在11個染色體上,以8號染色體的TLP基因家族成員數量最多,此基因家族成員在染色體上聚集分布的現象與劉潮(2017)、張華崇等(2019)TLP基因染色體定位結果一致,推測此基因家族擴增的主要方式是復制,組織特異性分析發現雖然各部位表達量不同,此研究與前人研究結果一致,但是在白樺中,與根、莖相比,表達量最高的家族成員在葉片中,此結果與前人研究差異性較大(Masakietal.,2014)。對基因啟動子區順式作用元件分析發現,家族成員含多個生物與非生物響應元件,但是不同的家族成員所含順式作用元件的類型及數量均不相同,與谷子中類甜蛋白結果的復雜性相符(劉潮,2018),說明白樺TLP基因家族成員參與植物多種生命進程。本研究為探究白樺TLP基因家族功能提供參考。
3材料與方法
3.1材料白樺植株為本實驗室培養,培養條件為28℃、光照/黑暗為16h/8h,光照強度1500lx。將正常生長的白樺植株的根、莖和功能葉片分別取下后迅速放于液氮中速凍,-80℃保存備用。3.2白樺TLP基因家族成員的鑒定使用CoGe(https://genomevolution.org/coge/)在白樺物種中搜索TLP基因序列,將全部序列下載下來后,放入NCBI(https://www.ncbi.nlm.nih.gov/)中進行同源性比對及保守結構域分析,將其中同源性比對較高且含有TLP-PA結構域的序列篩選出來,剔除冗余序列。
3.2白樺LP基因家族成員的生物信息學分析使用COGE數據庫獲取白樺TLP家族基因ATG上游1500bp序列,并通過PLantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對基因啟動子區順式作用元件進行分析;前人將擬南芥TLP基因家族成員根據功能不同分為10個聚類組(JiaandXiao,2010),在NCBI中搜索并下載擬南芥TLP基因家族成員序列(AT4G38660、AT1G75800、AT5G24620、AT1G19320、AT4G11650、AT1G77700、AT2G27890、AT5G40020、AT1G73620、AT5G02140),采用鄰接法(Neighbor-Joining,NJ)構建系統發育樹;其它分析工具及網絡地址。
作者:畢德瀧寧小萌孫晶晶馮思雨李然紅*