poly(A)尾对真核生物mRNA具有关键的调控功能,是其稳定性的重要决定元件。尽管poly(A)尾如此重要,在被发现后的几十年里,其序列竟然极少被精确解读过。主要原因在于,扩增简单串联的单核苷酸序列会导致聚合酶滑动,从而造成测序结果的移码和乱码。近几年,一些针对mRNA尾的高通量测序技术逐步建立。例如,PAL-seq通过不同poly(A)长度样品的标准曲线估计待测定mRNA的poly(A)尾长度。Tail-seq则针对二代测序的原始图像数据开发了算法,通过与标准品比较,推断poly(A)尾的长度及序列。人类细胞系中Tail-seq的结果显示:poly(A)尾内存在非A核苷酸(G,U,C),其中鸟苷酸G所占比例最高。然而,由于难以进一步获得相关突变体,目前对于poly(A)尾中G的分子功能以及作用机制仍鲜有报道。
中国科学院遗传与发育生物学研究所、植物研究所以及宾夕法尼亚大学合作,通过对mRNA全长poly(A)尾进行测序并发展下游生物信息学算法提取高质量测序信息,发现在模式植物拟南芥的poly(A)尾中存在非A核苷酸,且G的比例最高:10%的poly(A)尾内含有至少一个鸟苷酸G,其G含量分布范围为0.8-28%。研究人员随后以拟南芥poly(A)结合蛋白家族核心成员AtPAB2、AtPAB4和AtPAB8为研究对象,构建了一系列重要的突变体。并通过进一步整合CLIP-seq、ribo-seq和mRNA稳定性检测等高通量实验技术发现:在poly(A)尾中G含量的差别可导致AtPAB对不同mRNA的差异结合,且G可通过对AtPAB的结合抑制效应下调mRNA的翻译效率。该研究充分展示了测序技术与算法的结合在解析生物大分子调控过程中的强大优势。其研究结果是对分子生物学中心法则的拓展与创新,对探究其他物种中mRNA的转录后调控机理具有重要参考价值。
上述研究于2019年9月3日在Genome Biology杂志上在线发表 (DOI:10.1186/s13059-019-1799-8) 中国科学院遗传与发育生物学研究所肇涛澜、郇庆、孙婧与刘春艳博士为共同第一作者;曹晓风与钱文峰研究员为共同通讯作者;中科院植物所刘春明研究组与宾夕法尼亚大学Brian D. Gregory研究组也参与了研究工作。该研究得到国家自然科学基金委、科技部、中国科学院以及植物基因组学国家重点实验室的资助。
图: poly(A)尾中的鸟苷酸(G)可通过抑制与AtPAB的结合下调翻译效率