● 摘要
动物线粒体DNA(Mitochondrial DNA)的序列和结构是目前动物基因组研究的热点。研究内容包括:DNA序列测定、碱基组成分析、密码子结构、RNA二级结构、基因排列顺序等。这些信息可用于动物系统发育和进化研究。虽然有大量昆虫的线粒体DNA全序列已得到研究,但蜻蜓目仅报道了11种蜻蜓的线粒体DNA全序列,扇蟌科没有物种进行过全线粒体基因组测序,色蟌科仅有一个物种做过全线粒体基因组测序,研究相对较少。
本研究采用高通量测序的方法对扇蟌科的白扇蟌(Platycnemis foliacea)和色蟌科的黑色蟌(Agrion atratum)线粒体基因组全序列进行测定,并进行线粒体全基因组的拼接、注释和分析。进而结合NCBI数据库已收录的11种蜻蜓目线粒体基因组的PCGs、rRNAs和rRNAs & PCGs三个数据集,以蜉蝣目的东方蜉蝣(Ephemera orientalis )为外群,采用最大简约法(Maximum Parsimony, MP)、最大似然法(Maximum Likehood, ML)和贝叶斯推论法(Bayesian inference, BI)构建系统发育树,对蜻蜓目物种的系统发生关系进行分析。主要结论如下:
1. 白扇蟌和黑色蟌mtDNA全序列长度分别为15418 bp 和15506 bp,其线粒体基因组均包括:13个蛋白基因、2个rRNA基因、22个tRNA基因以及一个A+T丰富区。其中4个蛋白基因、8个tRNA和2个rRNA基因由L链编码,剩余的其他基因则由H链编码。白扇蟌mtDNA基因重叠区14处44 bp,基因间隔区8处72 bp;黑色蟌mtDNA基因重叠共12处40 bp,基因间隔共10处77 bp。白扇蟌和黑色蟌mtDNA全序列及其各部分的碱基组成均具有AT偏向性,A+T的含量大于G+C的含量。其AT偏斜值和GC偏斜值为正值时,表明碱基A的含量大于T的含量,G的含量大于C的含量,反之表明碱基A的含量小于T的含量,G的含量小于C的含量。
2. 白扇蟌和黑色蟌线粒体基因组13个蛋白质编码基因中,其中以ATN起始密码子的蛋白基因分别为6个(ND2、COⅡ、ATP8、COⅢ、ND6和Cytb)和8个(ND2、COⅡ、ATP8、COⅢ、ND6、ND3、Cytb和ND1),以AAT起始的蛋白基因分别为3个(ND5、ND4和ND4L)和4个(COⅠ、ND5、ND4和ND4L),其剩余的分别以TTN和TTG起始。两种蟌的线粒体基因组13个蛋白编码基因中均包括两种终止密码子:完全终止密码子和不完全终止密码子。白扇蟌和黑色蟌mtDNA均编码22个tRNAs基因,分布于rRNAs基因和PCGs之间。其tRNAs基因二级结构中,碱基错配分别为37处和32处,均以G-U错配为主。白扇蟌和黑色蟌的rRNAs基因(s-rRNA和l-rRNA)均位于tRNALeu(L2)基因与A+T rich region之间。两种蟌的控制区均位于s-rRNA与tRNAIle之间,A+T%含量分别为81.3%和87.1%,均存在A+T的偏向性。
3. 13种蜻蜓目昆虫线粒体全序列核苷酸A、T 、G、C的使用情况中,碱基A的含量均为最高,碱基G的含量均为最低。其线粒体PCGs,蛋白质编码基因H链和L链的碱基使用情况中,含量最高的均为碱基T,含量最低的是碱基C和G。13种蜻蜓目昆虫mtDNA全序列及各部分的碱基组成均具有AT偏向性,A+T的含量大于G+C的含量。在密码子使用上,13种蜻蜓目昆虫线粒体基因组蛋白质编码基因的H链,L链及PCGs均具有偏好性。RSCU分析显示,以碱基A或碱基T结尾的那些同义密码子的出现次数远高于其余同义密码子的出现次数。
4. 以13种蜻蜓目昆虫线粒体基因组PCGs和rRNAs & PCGs数据集分别构建系统发育树,使用MP、ML和BI法。在这三种方法构建的系统发育树中均是将蜻蜓目聚为了两个分支,各分支的拓扑结构基本相同。其中一大分支中扇蟌科的白扇蟌与蟌科的波瘦蟌聚在一起形成姐妹群,溪蟌科与色蟌科和拟丝蟌科聚在一起。另一分支中蜻科与伪蜻科聚在一起。而在rRNAs数据集中,使用三种方法构建的系统发育树与PCGs和rRNAs & PCGs数据集有些差异。系统发育分析的结果表明蟌蜓科的系统发育地位还不能确定。此外拟丝蟌科的丽拟丝蟌与溪蟌科的短腹幽蟌的亲缘关系,及同一蜻科中不同属的3个种之间的亲缘关系也需要进一步的研究。