当前位置:首页 > 思想汇报 > [烟草马铃薯Y病毒完整基因组的统计特征]马铃薯Y病毒
 

[烟草马铃薯Y病毒完整基因组的统计特征]马铃薯Y病毒

发布时间:2019-02-24 03:52:44 影响了:

  摘要:提取4个不同来源的烟草马铃薯Y病毒完整基因组的统计特征,并对它们进行聚类分析。在烟草马铃薯Y病毒完整基因组的碱基序列上,用每个碱基及其随后两个碱基所构成的三碱基组,排列成一个新的序列S,计算所有64种不同三碱基组在S上出现的概率,得到一个64维向量L;比较各个基因组的L向量,得到4个三碱基组(CAA、GAT、GTA、GAC),它们的概率有明显的差异。这4个三碱基组的出现概率与烟草马铃薯Y病毒基因组的遗传变异有着重要关联;4个不同来源的烟草马铃薯Y病毒完整基因组,按其遗传变异结果,形成两个大类。
  关键词:烟草马铃薯Y病毒;三碱基组;概率;K-M聚类;
  中图分类号:S435.72;Q78 文献标识码:A 文章编号:0439-8114(2011)09-1821-02
  
  The Statistical Characteristics of Potato Virus Y Complete Genome
  
  YANG Shuo,LI Jian-xue
  (Xiangcheng Tobacco Monopoly Bureau, Xiangyang 441000,Hubei,China)
  
  Abstract: The statistical characteristics of the complete genome of 4 potato virus Y(PVY) with different resources were extracted and cluster analyzed. A new sequence S was arranged by the three-base groups composing every base and its following two bases in PVY complete genome. And then a 64-dimensional vector L was obtained by caculating the appearance probability of each of the 64 three-base-groups. 4-three-base-groups(CAA,GAT,GTA,GAC) whose appearance probability was great different was identified by comparingL vector of every genome. The appearance probability of these four three-base-groups has great ralations with genetic variation of PVY. And the 4 complete genome of PVY was clustered into two groups according to the result of genetic variation.
  Key words: potato virus Y; three-base-groups; probability; K-M clustering
  烟草马铃薯Y病毒(PVY)侵染烟草引起的病害,又称作脉坏死病、褐脉病、黄斑坏死病等。系统分析和研究烟草马铃薯Y病毒基因组的统计特性、结构特征和遗传变异规律,进而采用基因工程技术对烟草马铃薯Y病毒病进行防治,是一个有重要理论意义和实用价值的课题。本文提取4个不同来源的烟草马铃薯Y病毒完整基因组的统计特征,并对它们进行聚类分析。
  1材料与方法
  1.1材料
  4个不同来源的烟草马铃薯Y病毒的完整基因组GenBank X12456.1(G1)、GenBank EF026074.1(G2)、GenBank FJ643477.1(G3)、GenBank FJ643478.1
  (G4)来自NCBI数据库[1];采用MATLAB 7.0软件计算64种三碱基组出现的概率和K-M聚类分析。
  1.2方法
  在第i个烟草马铃薯Y病毒完整基因组的碱基序列上,用每个碱基及其随后两个碱基所构成的三碱基组,排列成一个新的序列S;计算64种不同三碱基组在S上出现的概率,得到一个64维向量L;比较各个基因组的L向量,得到一些三碱基组,它们的概率有明显的差异。
  依照如下的规律,给三碱基组赋予数字代码:
  1.AAA;2.AAT;3.AAC;4.AAG;5.ATA;6.ATT;…;64.GGG。
  最后,对4个不同来源的烟草马铃薯Y病毒完整基因组按照L向量进行K-M聚类分析。
  2结果与分析
  2.1L向量和各L向量之间的差向量
  L向量是一个概率值向量(64种不同三碱基组在基因组上出现的概率)。4个不同来源的烟草马铃薯Y病毒基因组的L向量分布如图1所示,它们的差如图2所示。通过图1和图2可以了解烟草马铃薯Y病毒基因组遗传变异过程中最活跃的10个三碱基组(表1)及最保守的10个三碱基组(表2)。
  大部分三碱基组在4种不同来源的烟草马铃薯Y病毒基因组上出现的概率差别不大,只有若干个三碱基组在基因组上出现的概率差别较大(表1和表2)。
  2.2K-M聚类
  对不同来源的烟草马铃薯Y病毒完整基因组,按照其L向量进行K-M聚类分析,得到聚类树状图(图3)。由聚类树状图可以看出各基因组的遗传变异关系分为两个大类。其中,4个不同来源的烟草马铃薯Y病毒完整基因组有着不同的演化路径:G1、G2与G3、G4两个演化路径变异较大。
  3小结
  4个三碱基组(CAA-33号、GAT-50号、GTA-53号、GAC-51号)的出现概率与马铃薯Y病毒完整基因组的遗传变异有着重要关联;5个三碱基组(AAT-2号、ACA-9号、CAT-34号、CGC-47号、GGC-63号)是较为保守的三碱基组;4个不同来源的烟草马铃薯Y病毒完整基因组,按其遗传变异结果,分为两个大类。本文的研究方法普遍适用于各种烟草病毒基因组序列的分析[2-4]。在遗传变异过程中,最活跃的三碱基组(CAA、GAT、GTA、GAC)的物理、化学和生物学效应的研究,是一个有意义的课题;而最保守的三碱基组(AAT、ACA、CAT、CGC、GGC)在基因组上的功能,与这一物种的本质特性有着重要的关联。在实验室对最活跃和最保守的三碱基组进行相关试验,可以获得遗传变异的某些效应。
  参考文献:
  [1] ALLISON R F,DOUGHERTY W G,PARKS T D, et al. Tobacco etch uirus, complete genome[EB/OL]. http://www.ncbi.nlm.nih.gov/nuccore/NC_001555.
  [2] 兰平秀,程建勇,李凡,等. 烟草扭脉病毒部分基因组特征及其分类地位分析[J]. 农业生物技术学报,2008,16(1):177-178.
  [3] 郭兴启, 温孚江, 宋云枝,等. 翻译和非翻译马铃薯Y病毒外壳蛋白基因介导的抗病性比较[J]. 病毒学报,2001,17(4):360-367.
  [4] 杨纪青, 杨硕, 杨莉, 等. Tomato leaf curl Bangladesh病毒完整基因组上微卫星分布[J].中国农学通报,2010,26(24):20-27.
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3