隨著二代、三代測序技術的飛躍發展,越來越多的高等植物全基因組信息被破譯。相比被子植物,裸子植物因其基因組巨大,重復序列占比高等特征,使得相關全基因組研究工作稍顯滯后。自2012年第一個裸子植物火炬松全基因組草圖發布,到2022年初蘇鐵基因組工作完成,標志著包括松柏類、銀杏、買麻藤類在內的現存裸子植物四條傳代線類群參考基因組均已覆蓋。
盡管上述基因組草圖繪制完成,但涉及到裸子植物類群復雜基因組結構演化的諸多基礎問題有待深入探討。為此,中科院武漢植物園萬濤研究員和王青鋒研究員團隊應GigaScience邀請,發表了題目為“Evolution of complex genome architecture in gymnosperms”的綜述論文,就過去十年裸子植物全基因組研究工作進行了系統梳理,針對其超大基因組形成和演化所關聯的遺傳機制進行了總結和歸納,并對部分先前的一些結論進行了詳細討論:包括重復序列進化模型、古多倍化爭議、長內含子特征及其影響等。對后續學者開展裸子植物全基因組研究提出了四點建議:1)呼吁更多的工作在裸子植物中等基因組大小的類群中展開(4-10 Gbp),同時提升已有松科類群的基因組組裝質量;2)針對重復序列應重點關注低拷貝序列的鑒別和進化分析;3)建議關注裸子植物全基因組甲基化圖譜的繪制以及長內含子特征的生物學意義探索;4)開展更多高質量裸子植物比較基因組學的研究,補充對裸子植物系統發育關系的討論,重點關注裸子植物起源古多倍化事件的確立以及對后續譜系發展的潛在貢獻。
圖:裸子植物全基因組測序組裝概況, 復雜基因組特征及進化歷史