提供专业的生物信息产品与服务
严于治学,精于服务!
新闻详情
组学大数据时代分析工具将何去何从
浏览数:288


生产力是社会发展的最终决定力量,人类社会的发展就是一个解放生产力发展生产力的过程。总体来看,从原始社会到现如今生产力一直在不断发展。

这样说给人的感觉很笼统,那么咱举个例子—交通工具的发展演化。在早些时候,人类还没有“交通工具”这一代名词,那时,人们主要是靠步行来相互走访联系的。后来,在人们的智力水平有了显著提高后,有了马车等畜力交通工具,也算是交通工具史的一个“巨大”的飞跃了,接着便是自行车、火车,汽车、飞机也应运而生成为现代社会交通工具的主流,未来普通人乘坐宇宙飞船去太空也会是一件很容易的事。

随着DNA测序、质谱测序等高通量技术的快速发展,生命科学领域进入了以海量多元组学数据为特征的大数据时代。组学大数据给生命科学研究带来了前所未有的机遇,在研究基因功能、疾病机制、精准医疗等方面具有重要意义。大数据具有规模性、多样性、高速性等三个特征,给传统生物信息学带来了新的挑战。在数据计算方面,亟需解决中小实验室对计算资源的弹性需求;在数据分析方面,亟需多组学整合分析体系解决生物学问题。缺乏相应的生物信息学工具是大数据时代生命科学领域面临的主要瓶颈。

在这个压力下催生了许多生物信息学的分析工具,但往往这些软件适应面相对较窄,做一套组学的数据分析要掌握许多软件的使用方法,对分析人员的编程能力也有一定要求,那么有没有一种简单而又全面强大的分析工具呢?显然是有的,国外类似的软件有IPA和Pathwaystudio,国内目前唯一的一家就是金弗康生物研发的生物大数据分析平台Omicsbean。

举个例子,一项肾损伤的课题,五个处理组和一个正常组,每组三个生物学重复,每次重复需50例尿液样本,即每组需要150例病人尿液样本。对取得的尿液样本做iTRAQ 联合 LC-MS/MS 进行蛋白质鉴定和含量分析,五个处理组各自比上正常组得到差异列表。

以某一患者组为例,从150例尿液样本中得到156个差异蛋白,经过venn分析,找出该组独有的特异性蛋白做功能分析和分子机制模型构建。

本模型中主要看C8G、TNXB、SPINK5三个基因,其中C8G表达的是Complementcomponent C8 gamma chain,参与形成膜攻击复合体;TNX8表达的是Tenascin-X,参与细胞和胞外复合体的交流,并且参与抑制细胞迁移的生物过程;SPINK5表达的是Serine protease inhibitor Kazal-type 5,在抗炎或抗菌的保护过程中起着重要作用。

从模型来看,炎症反应下C8G表达增加,补体系统被大大激活后促进了蛋白代谢过程,与此同时细胞黏附正常功能被抑制(TNX8和SPINK5表达下调),说明在细胞内的平衡处于失调状态。炎症反应效能大于免疫反应,导致肾功能异常。其中 TNX8和SPINK5表达量下调,可能表现为其拥有的抑制细胞迁移功能减弱,抗炎或抗菌的保护减弱。但具体下调原因以及与炎症免疫反应子网络的关联不明,需进行下一步研究。

对于这套数据用Omicsbean组学大数据分析平台不到半个小时就能分析出来,而如过使用其他方法软件来处理所花费的时间与精力就好比“自行车”与“汽车”的差别了。当然,Omicsbean也在不断发展完善中,比如上传一套数据,中间不需要任何操作就可以得到自己想要的结果图表,这就达到了“飞机”的水平了。简单来说,组学数据的分析终将朝着快速、简单而又智能的方向不断发展。