提供专业的生物信息产品与服务

H7N9生物信息学分析

22209

 NCBI数据库中已有4条杭州疾控中心提交的新H7N9基因,包括neuraminidase(NA), matrix protein 1(MP1), hemagglutinin(HA) matrix protein 2(MP2). 我们从NCBI数据库中下载了目前所有的H7N9蛋白数据,共197条,来自于13个国家27个不同国家地域的H7N9病毒。病毒最多编码11个蛋白序列:nuclear export protein(NEP), neuraminidase(NA), hemagglutinin(HA), PB1-F2protein(PB1), polymerase PB2(PB2), nonstructural protein 1(NS), nucleocapsidprotein(NP), polymerase PA(PA)polymerase PB1(PB1), matrix protein 1(MP1), matrix protein 2(MP2). 通过对全基因序列进行比对和进化树的构建,我们可以看出,H7N9所编码的11个蛋白很清晰的构成了树的11个分支,中间不存在任何交叉,说明在H7N9的基因都在相对独立的进化,不存在基因内重组情况。而新H7N9HA蛋白与2008年在蒙古发现的H7N9病毒的HA蛋白最为相近。而和NA蛋白最为相近的是捷克2009年发现的H7N9病毒和2008年的蒙古H7N9病毒。这能不能说明H7N9是有蒙古种演化而来呢?这需要在整个甲型流感病毒各亚型所含有的HA蛋白和NA蛋白中寻找证据,因为病毒繁殖过程中可能发生基因重组。南方科技大学近期用4组新H7N9的基因组数据进行了全家族的起源分析,结果发现HA其实和浙江H7N3中编码的HA蛋白最为同源。而NA则捷克2010年的H11N9最为同源,而2008年蒙古与2009年的捷克H7N9虽然同属一个分支,却相对较远。在中科院使用HANA的基因序列进行的起源分析中,HA也是与浙江H7N3最为同源,而NA则与南韩2011年的H7N9最为同源。2008年的蒙古H7N9病毒,2009年的捷克H7N9病毒和2010年的捷克H11N9病毒则被归为相对较远的一个分支中。由此,可以比较确定的说HA的来源应该是浙江的H7N3,而非蒙古H7N9。而由于南大的分析中未包含2011年韩国H7N9数据,所以难以判断最终定论N9的来源到底是捷克2010年的H11N9还是韩国2011年的H7N9。运用blast软件通过使用新H7N9NA蛋白序列以及核酸序列对NCBI数据库进行比对以及进化树构建分析,结果发现,无论是基因结果还是蛋白结果支持中科院的结果,较捷克2010年的H11N9病毒,新H7N9NA基因确实与2011年韩国的H7N9更为相近。



文章分类: 精选案例