隨著二代測序技術的飛速發展,植物葉綠體基因組序列已普遍應用于重建植物“生命之樹”研究中。大多數植物葉綠體基因組呈環狀四分體結構,包含約80個蛋白編碼基因。葉綠體基因組由于缺乏重組而通常被認為是連鎖的單一基因座;然而,越來越多的研究證據表明,葉綠體基因組中不同區域以及不同編碼基因具有不同的核酸替代速率,經受不同的自然選擇壓力。目前對于葉綠體單基因或不同功能組基因的進化研究還很少。另外,傳統基于葉綠體基因組的系統基因組學研究通常直接將葉綠體基因組直接串聯起來進行系統樹構建,因此單基因遺傳變異導致的系統發育不一致性往往被忽略。
龍膽族包含龍膽亞族和獐牙菜亞族,大多數物種生長在青藏高原高山草甸及流石灘,包含許多著名的高山花卉和藥用植物,如龍膽、獐牙菜、秦艽、扁蕾等,是理解高山植物演化和適應性的良好類群。龍膽族內系統關系也一直沒有很好的解決,基于DNA片段的系統學研究往往不能提供很好的分辨率。
中國科學院植物種質創新與特色農業重點實驗室系統與進化學科組采集了龍膽族10個屬的樣品,進行葉綠體基因組測序,探討龍膽族系統發育關系以及葉綠體基因組進化。系統發育分析得到了各屬之間穩健的系統關系,其中獐牙菜屬不是單系。研究發現單基因系統樹之間存在很大的變異,而將所有基因串聯建樹掩蓋過了單基因帶來的差異。超過一半的基因導致龍膽族混亂的系統關系,其中包括常用分子標記。這可能解釋了以往使用DNA片段的研究無法很好的重建該族系統發育關系。對核苷酸替代率的估計顯示,不同葉綠體基因之間以及不同功能組基因之間存在廣泛的替代率異質性。比較分析表明,核糖體蛋白基因和RNA聚合酶基因在龍膽族葉綠體基因中具有較高的替代率和遺傳變異;參與光合作用的編碼基因較為保守。比較分析揭示了rpoC2基因具有較高系統發育信息性,可用作龍膽族分類學研究的條形碼。此外,龍膽族葉綠體蛋白編碼基因組都經歷著純化選擇,純化選擇對有害變異的過度清除可能會模糊對系統發育關系的推斷。
該研究首次利用系統基因組學揭示龍膽族內系統發育關系,為以后研究該族物種的起源和進化打下基礎。比較基因組學分析揭示了廣泛的進化速率異質性和質體基因間的遺傳變異;同時揭示了普遍存在的單基因樹系統發育不一致,突出了在未來的系統基因組學研究中考慮基因樹異質性的必要性。相關研究成果以“Plastome phylogenomic study of Gentianeae (Gentianaceae): widespread gene tree discordance and its association with evolutionary rate heterogeneity of plastid genes”為題發表在國際著名期刊BMC Plant Biology。系統與進化學科組博士生張旭為論文第一作者,王恒昌研究員指導完成。
論文鏈接:https://doi.org/10.1186/s12870-020-02518-w
Researchgate 鏈接:https://www.researchgate.net/publication/343035887
圖1:龍膽族植物(張旭拍攝)