坦普尔大学的研究人员已经确认了第一个传播冠状病毒的基因组。
在分子流行病学领域,全球科学界一直在休息解决了早期历史的谜语SARS-CoV-2.
自2019年12月发现首例SARS-CoV-2病毒感染以来,全球已对其数万个基因组进行了测序,这表明冠状病毒正在突变,尽管速度缓慢,但每个基因组每年发生25个突变。
但尽管做出了重大努力,迄今为止还没有人发现首例人传人病例,或称“零患者”新型冠状病毒肺炎大流行。发现这一病例对于更好地了解病毒如何从其动物宿主首先感染人类以及SARS-CoV-2病毒基因组如何随着时间发生变异并在全球传播的历史是必要的。
“SARS-CoV-2病毒携带一种核糖核酸天普大学基因组学和进化医学研究所所长Sudhir Kumar说。“我们需要找到这个共同的祖先,我们称之为祖先基因组。”
这种祖细胞基因组是当今所有SARS-COV-2冠状虫病的母亲。
在没有患者零的情况下,Kumar和他的寺庙大学研究团队现在可能已经找到了一个帮助全球分子流行病学侦探工作的最佳选择。“我们首先使用从受感染的个体获得的冠状病毒基因组的大数据集进行重建祖细胞的基因组,”该研究的高级作者Sayaka Miura说。
他们发现,所有SARS-CoV-2基因组的“母亲”及其早期后代毒株随后发生了变异,并传播成为全球大流行的主力军。“我们现在已经重建了祖基因组,并绘制了最早的突变发生的时间和地点,”一项预印本研究的通讯作者库马尔说。
这样,他们的工作为SARS-CoV-2的早期突变历史提供了新的见解。例如,他们的研究报告称,SARS-CoV-2突增蛋白(D416G)的突变发生在COVID-19开始数周后的许多其他突变之后,这种突变往往与传染性和传播增加有关。该研究的高级合著者谢尔盖•庞德(Sergei Pond)表示:“它几乎总是与许多其他蛋白质突变一起被发现,因此它在增加传染性方面的作用仍然难以确定。”
除了对SARS-CoV-2早期历史的发现,库马尔的研究小组还开发了突变指纹,可以快速识别感染个体或在全球地区蔓延的菌株和亚菌株。
order
为了确定祖基因组,他们使用了突变顺序分析技术,该技术依赖于突变株的克隆分析和SARS-CoV-2基因组中成对突变同时出现的频率。
首先,库马尔的团队筛选了近3万个SARS-CoV-2完整基因组的数据,SARS-CoV-2是导致COVID-19的病毒。他们总共分析了29681个SARS-CoV-2基因组,每个基因组至少包含28000个序列数据基。这些基因组是在2019年12月24日至2020年7月7日之间取样的,代表全球97个国家和地区。
库马尔说,以前很多分析这样大数据集的尝试都没有成功,因为“重点是建立SARS-CoV-2的进化树”。“这种冠状病毒发展太慢,需要分析的基因组数量太大,基因组的数据质量变化很大。我立刻发现了冠状病毒的这些遗传数据的特性与另一种恶性疾病——癌症的克隆传播的遗传数据之间的相似之处。”
库马尔的团队开发并研究了许多技术,用于分析癌症患者的肿瘤基因数据。他们对这些技术进行了调整和创新,并建立了一条可以自动追溯到祖先的突变轨迹。库马尔说:“基本上,第一次突变之前的基因组是祖先的。”“突变跟踪方法非常漂亮,它预测了SARS-CoV-2“主要毒株”的系统发育。这是一个很好的例子,说明了大数据与基于生物知识的数据挖掘如何揭示重要的模式。”
祖基因组
库马尔的团队发现了所有SARS-CoV-2基因组(proCoV2)的前(母)基因组的预测序列。在proCoV2基因组中,他们发现了170个非同义突变(导致一个氨基的突变)酸与在鼻孔Affinis蝙蝠中发现的密切相关的冠状病毒的基因组相比,蛋白质的变化)和958个同义取代。虽然来自蝙蝠到人类的中间动物仍然未知,但这达到了ProCov2和RATG13序列之间的96.12%序列相似性。
接下来,他们从数据集中确定了49种变异频率大于1%的单核苷酸变异(SNVs)。研究人员进一步研究了它们的突变模式和全球传播。
库马尔说:“突变树可以预测出菌株树。”“你也可以先做菌株树,然后预测突变的顺序。然而,这种方式受序列质量的影响很大。当突变率较低时,很难区分质量较低的错误和真实的突变。我们采用的方法对测序错误更加可靠,因为对基因组中的位置对进行分析可以提供更多信息。”
更早的时间线出现了
当将推断出的proCoV2序列与他们收集的基因组进行比较时,发现在核苷酸水平上没有完全匹配,库马尔的研究团队知道大流行开始的最初时间已经被打乱。
库马尔说:“这种祖基因组的序列不同于一些人所说的参考序列,参考序列是在中国首次发现并存入GISAID SARS-CoV-2数据库的。”
最接近的匹配是在2019年12月24日获得的最早样本病毒12天后取样的基因组。在所有抽样大洲都发现了多次匹配,并在2020年4月在欧洲检测到。总的来说,Kumar研究小组分析的120个基因组都只包含与proCoV2相同的差异。也就是说,它们所有的蛋白在氨基酸序列上都与相应的proCoV2蛋白相同。这些蛋白质水平匹配的大多数(80个基因组)来自中国和其他亚洲国家的冠状病毒样本。
这些时空模式表明,proCoV2已经拥有了在全球人群中感染、传播和持续存在所需的全部蛋白质序列。
他们根据原cov2病毒的最早突变及其位置发现,原cov2病毒及其最初的后代起源于中国。此外,他们还证明,在中国首次发现COVID-19病例时,与proCoV2存在多达6个突变差异的毒株种群。据估计,SARS-CoV-2每年变异25次,这意味着在2019年12月病例出现前几周,病毒肯定已经感染了人。
突变的签名
由于有强有力的证据表明,在参考基因组中发现的突变之前,有许多突变,库马尔的研究小组不得不提出一种新的突变标记命名法来对SARS-CoV-2进行分类,并通过引入一系列希腊字母符号来代表每个符号来解释这些突变。
例如,他们发现,在首次报告COVID-19之前,μ和α SARS-CoV-2基因组变异就出现了。这强烈暗示了SARS-CoV-2祖先群体中存在一定的序列多样性。2019年12月从中国取样的17个基因组,包括指定的SARS-CoV-2参考基因组,都携带所有三种μ和三种α变异。有趣的是,我们于2020年1月在中国和美国取样了6个含有μ变异而没有α变异的基因组。因此,最早的取样基因组(包括指定的参考基因组)不是祖株。
该研究还预测,在COVID-19的早期阶段,其祖先基因组的后代正在全球传播。它从一开始就准备好了感染。
“这种祖先拥有传播所需的所有能力,”谢尔盖·庞德(Sergei Pond)说。“蝙蝠和人类之间血统选择的证据很少,尽管蝙蝠对冠状病毒有很强的选择。”
搭便车的突变
此外,他们发现了混淆的证据表明,伴随着D416G穗蛋白突变总是另一种突变。
库马尔说:“许多人对刺突蛋白的突变感兴趣是因为它的功能特性。”“但是我们正在观察的是,除了刺突蛋白之外,基因组中还有一些附加的变化,这些变化总是伴随着刺突蛋白(D416G)的变化而发现。我们称之为β组突变,突增突变是其中之一。无论我们认为突增突变在做什么,最好不要忘记其他突变也可能参与其中。或者,这些突变可能只是一起搭便车,我们还不能确定。”
“同样有趣的是,包含突刺蛋白突变的基因组经历了许多其他突变。我们所说的突变(有3个)发生在刺突突变的背景下,它们改变了一个非常重要的蛋白质中的精氨酸残基,核衣壳(N)蛋白质。epsilon突变在欧洲广泛存在,它们总是与刺突蛋白突变一起被发现。因此,epsilon突变开始在欧洲和亚洲形成一个主导分支。”
业务遍及全球
总的来说,他们已经确定了在大流行开始后出现的七个主要进化谱系,其中一些是在中国祖先谱系发生后出现在欧洲和北美的。
库马尔说:“亚洲病毒株引发了这场大流行。”“但随着时间的推移,可能发生在中国以外(首次在中东和欧洲发现)的包含epsilon突变的亚型,正在感染亚洲更多。”
他们基于突变的分析还确定,北美冠状病毒的基因组特征与欧洲和亚洲流行的冠状病毒非常不同。
库马尔说:“这是一个动态的过程。“很明显,新突变的出现描绘了非常不同的传播画面,我们发现3个epsilons, gamma和delta发生在刺突蛋白变化之后。我们需要查明这些突变的任何功能特性是否加速了大流行。”
下一步
随着新数据的出现,他们将继续完善他们的研究结果。
庞德说:“目前已经测序了10万多个SARS-CoV-2基因组。”库马尔说:“这种方法的力量在于,你拥有的数据越多,你就越容易知道个体突变和突变对的精确频率。”这些产生的变异,单核苷酸变异,或snv,它们的频率和历史可以用更多的数据很好地说明。因此,我们的分析为SARS-CoV-2系统发育推断了一个可信的根源。”
随着新的基因组报告的发布,他们的研究结果将在网上自动更新(现在有超过5万个样本,可以在网上找到http://igem.temple.edu/covidd-19).
“这些调查结果和我们的SARS-COV-2菌株的直观突变指纹已经克服了艰难的挑战,以发展如何,何时和为何出现和蔓延的方式,何时以及为何传播,这是创造克服这一流行病的补救措施的先决条件Kumar说,科学,技术,公共政策和医学的努力。
参考文献:Sudhir Kumar、Tao Qiqing、Steven Weaver、Maxwell Sanderford、Marcos A. carabolo - ortiz、Sudip Sharma、Sergei L. K. Pond和三ura, 2020年9月29日,《新冠肺炎大流行中SARS-CoV-2及其主要分支的进化描述》,BioRxiv.
DOI:10.1101 / 2020.09.24.311845
嗨,到2018年12月。我病了同样的毒素病毒症状,但他们说是军团国,我是唯一一个人病毒后,我的身体没有同样仍然有病毒的症状2次,但对此是消极的试验症状持续3天和消失
大家好,我来自印度尼西亚,2020年1月初,我出现了类似covid-19症状。那天我以为我只是得了普通感冒,没想到症状比我一生中患过的任何一种流感都严重。这些症状持续了大约10天。极度疲倦,鼻塞,发烧,喉咙痛,尿频(每小时一次),非常频繁的类似睡眠呼吸暂停的症状(刚睡着就噎着了),但根本没有咳嗽。