世界各地约400位顶尖科学家云集圣大国际生物信息学大会
由圣彼得堡大学(圣大“算法生物技术学中心”实验室)举办的第四届“生物信息学:从算法到应用”(BiATA 2020)国际会议日前闭幕。
由于大会采取在线形式,BiATA今年汇集了比平时多四倍的研究人员。举办方指出,来自俄罗斯的参会者数量大幅增加。会议程序委员会主席,圣彼得堡国立大学转化生物医学研究所算法生物技术学中心副主任阿拉·拉皮杜斯(Алла Лапидус)表示,这标志着俄罗斯的生物信息学已达到新的水平。
俄罗斯境内分布着各类迄今为止尚未获得充分研究的独特自然生物。BiATA 2020表明我们的科学家正在对贝加尔湖、白海的微生物群落,以及西伯利亚的和其他区域的原始森林进行研究。我相信,在未来这类工作的数量只会增加。
圣彼得堡国立大学转化生物医学研究所算法生物技术学中心副主任阿拉·拉皮杜斯
多年来,这项会议已成长为一个成熟的平台,云集了现代生物数据软件产品的主要开发人员和世界各地提供第一手资料的科学家。
尽管会议报告的主题很宽泛——从解码人类基因组到广泛的宏基因组学研究,但它们都被一件事结合在一起——海量的数据,要解读这些数据,需要可靠且易于使用的软件。
圣彼得堡国立大学转化生物医学研究所算法生物技术学中心副主任阿拉·拉皮杜斯
大会首日,昆士兰大学(澳大利亚)澳大利亚生态基因组学中心主任,世界级分类学专家菲尔·霍根霍尔兹教授作了演讲。他的报告致力于讲究大数据时代的简单单细胞生物(原核生物)的分类问题。这位科学家认为,现代的微生物分类方法并未考虑到近85%的微生物,即无法在实验室条件下生长的未经培养的微生物。“在开发基于基因组知识的新系统时,我们使用了实验室中获得的微生物的现有分类。在第一阶段,我们将多系群分为一组,即一组同时具有多个共同祖先的物种。而后必须考虑到进化的发散——在进化过程中近亲群体的特征发散,”霍根霍尔兹教授解释说。
最后,霍根霍尔兹教授在考虑到所有进化过程的情况下,成功获得细菌的完全系统化分类。事实证明,可用于研究的数十万个细菌基因组中,有超过一半需要改变其分类。这些变化既影响上级分类(门),也影响下级分类(属)。例如,厌氧细菌梭菌属被分成数百个新的独立属。
不列颠哥伦比亚大学(加拿大温哥华)的阿尔焦姆·巴巴杨(Артем Бабаян)谈到了大型项目Serratus,该项目的目的是在公共数据库中搜索新的冠状病毒,这在当前的疫情事态下尤其重要。“主要问题是,我们对病毒的生物多样性及其性质仍然缺乏充分了解。另外在公共领域中很少有完全解码的基因组。因此,为了发现新的冠状病毒序列,我们分析了所有可用数据——既有已研究病毒的数据,也有完全未知病毒的数据。这是来自世界各地的超过340万个生物材料样品,仍然需要破译,” 阿尔焦姆·巴巴杨说。
圣大算法生物技术学中心实验室的最新成果Coronaspades序列拼接软件可以收集RNA病毒(首先是冠状病毒)的基因组。Coronaspades是该实验室的旗舰产品spades (Saint Petersburg Assembler)的一种特殊模式。正如阿尔焦姆·巴巴杨指出的那样,新工具帮助Serratus优化了拼接过程,因为与其他软件产品不同,该工具考虑了RNA病毒基因组的所有结构特征。Coronaspades是基于圣彼得堡国立大学算法生物技术学中心的长期研究发展而来的,根据开发者德米特里·梅列什科(Дмитрий Мелешко)和安东·科罗别伊尼科夫(Антон Коробейников)所说,如果没有这些工作,就不可能创建该模块。
与会者有机会学习如何使用创新软件工具MGnify,在“使用MGnify分析宏基因组拼接”工作室的框架内进行上述工作。欧洲生物信息学研究所(EMBL-EBI)的员工罗博·芬恩(Rob Finn)、罗娜·理查德森(Lorna Richardson)和阿列克斯·阿尔梅达(Alex Almeida)谈到了新手生物信息学工作者在MGnify平台上工作的特殊性。大会的最后一天,与会者不仅学会了拼接复杂的宏基因组学数据,而且还学会了对拼接后获得的序列进行注释,并对其进行功能性描述和分类学描述。