对特定DNA片段的碱基序列进行分析的基因测序,可以用来诊断疾病,也可以用于疾病风险的预测。可以说这次全球新冠疫情的反击战,就是从中国科学家公布新冠病毒的基因序列开始的。这项技术对于识别和跟踪新冠病变异也发挥着关键的作用。随着测序的价格已经便宜了1000万倍,质量提高了100000倍,业内人士正在展望一个新的技术范式正在到来,我们即将进入一个不断监测身体和周围一切事物的遗传信息的未来。《纽约时报》杂志特约作者Jon Gertner聚焦了基因测序这个新的平台技术的最新进展,并为我们描绘了一个测序与诊断等同的未来世界。原文标题是:Tracking the Covid Code。篇幅关系,我们分三部分刊出,此为*部分。
划重点:
遗传组分被用于应对新冠病毒的方方面面
跟踪病毒变异离不开基因测序
测序仪变得更好、更快、更易用
基因组测序已经慢慢堆积起影响更为深远的希望
商业基因组测序的出现,最近被拿来跟显微镜的发明相提并论
在一片混乱与全球灾难之中,廉价,快速的测序时代已经悄然来临
2020年1月初的周六早上,Edward Holmes正在澳大利亚跟中国科学家张永振通过电话交谈,后者刚刚对一种正在感染武汉的新型病原体的基因组进行了测序。两位老朋友对结果产生了争执。悉尼大学病毒学家Holmes教授回忆说:“我知道我们正在研究的是一种呼吸道病毒。” 他还知道病毒看起来很危险。
Holmes问张永振能不能向公众分享该病毒的遗传密码?当时张永振正在等着飞机起飞。他希望给自己一分钟的时间考虑。于是Holmes就在电话这头等着。他听到空姐在敦促张永振关机。
“好吧,”张永振最后说。Holmes几乎是马上就把该序列发布在了一个名为Virologic.org的网站上。然后他又跑到Twitter上公布相关网页的链接。Holmes知道,世界各地的研究人员会立即着手去解开这一病原体的密码,好找到击败它的方法。
从Holmes*次把病毒基因组发布出去的那一刻起,如果留意的话,在我们的公共卫生对SARS-CoV-2几乎所有的应对措施当中你几乎都能找到一个遗传组分。比方说,制药公司往往需要病毒样本来制备疫苗。但是,一旦序列出现在公共领域,马萨诸塞州剑桥市的一家不起眼的生物技术公司,莫德纳(Moderna)马上就开始跟美国国立卫生研究院(NIH)合作制定一项计划。去年夏天,也就是莫德纳的疫苗拿到FDA紧急使用授权的6个月前,依诺米那(Illumina,张永振就是用他们的测序仪进行病毒基因测序的) CEO Francis deSouza用稍带震惊的语气说:“他们手头根本就没拿到病毒,他们的确只是利用了病毒的基因序列,并把它看作是软件问题。”该病毒的代码也让整个测试行业都动起来了。只有通过分析病毒遗传序列的特征,科学家才能为所谓的PCR(聚合酶链式反应测试,几十年来一直在利用遗传信息来进行快速诊断测试)设备制作出试剂盒。
与此同时,基因测序也被用来跟踪病毒的变异——2020年2月发表的研究表明该病毒正在美国传播。这项工作属于基因组流行病学(“gen epi ”)的范畴。其中很多的洞察可以追溯到1990年代中期英国牛津大学的一群研究人员,当中就有Holmes。他们认为,每10天(像流感)或者每20天(像埃博拉)跟踪获得持久性突变的病毒的进化变化,在本质上类似于在对动物的跟踪,不过后者的进化也许每百万年才发生一次。
这项工作中早期遇到的障碍之一是太过乏味。牛津大学的研究小组必须通过一个缓慢而审慎的流程来对遗传标记进行分析,从中去洞察出每种新变体的几十个特征。这个缓慢的过程直到2000年代末才有了改观,由于计算机技术的巨大飞跃,基因测序仪也得到了巨大改进,研究人员终于可以更轻松、更快速地读取病毒的完整遗传密码,以及人类、动物、植物和微生物的遗传蓝图了。
在公共卫生领域,基因组测序变快带来的*个重大突破出现在2014年,当时,在非洲爆发疫情期间,麻省理工学院和哈佛大学的一个研究小组开始对受感染者的埃博拉病毒样本进行测序。他们的工作表明,通过对遗传密码进行对比,可以识别出隐藏的传播途径并将其打破,从而有可能减慢(甚至阻止)传染。这就是后来所谓的基因监测的最早的实际用例之一。几年之后,随身携带了便携式基因组测序仪的医生开始跟踪中南美洲的寨卡病毒。测序仪变得更好、更快、更易用。
对于很多人来说,他们对这项技术最熟悉的面孔是临床试验公司。这些公司会用测序仪来读取我们的部分遗传密码(基因包测序panel或外显子组测序exomes)来研究一些关键基因,比方说那些跟患乳腺癌更高风险相关的基因。但是,近年来,在从个人健康到文化人类学再到环境监测等领域,基因组测序已经慢慢堆积起影响更为深远的希望。依赖测序的技术Crispr让科学家有可能修复我们基因组中引起疾病的突变。“液体活检”(Liquid biopsies)通过分析少量血液当中的DNA标记物,可以让我们在症状出现之前很早就给出对癌症诊断的预期。哈佛大学遗传学家George Church表示,有朝一日可能只需传感器 “抿一口空气”,手机上的基因组app就可以告诉我们屋内是否存在病原体。测序甚至可能可以把我们想要的DNA的任何类型的数据都存储起来——从理论上来说,这样的归档系统会非常的高效和高密度,以至于整个互联网的内容都保存在一个枕套里面。
科学史学家有时会讨论新范式或新思维方式,会改变我们对真实或可能存在的事物的集体思维的那种。但是,范式的演变不仅发生在新思想取代旧思想之时,当新工具让我们可以去做或者看之前不可能会考虑的事情/东西时,也会发生范式的演变。商业基因组测序的出现,最近被拿来跟显微镜的发明相提并论(这种比较还是可信的),这不禁让我想知道,这种依旧相对晦涩但在世界范围内大举杀进了装备完善的实验室的新技术,会不会被证明是21世纪最重要的创新?按照Church的估计,“跟几年前相比,测序的价格已经便宜了1000万倍,质量提高了100000倍。” 如果说一种新的技术范式正在到来,并会带给我们一个不断监测身体和周围一切事物的遗传信息的未来的话,那么这些(方便快捷无处不在的)测序仪就是带我们进入那个王国的机器。
让人没想到的是,事实证明,Covid-19就是那个催化剂。deSouza 说:“这场疫情把基因组学者传染病的采用速度加快了好几年。”并且他相信这场疫情还加快了基因组学在更广泛的社会的采用——这表明,在一片混乱与全球灾难之中,廉价,快速的测序时代已经悄然来临。
在一片混乱与全球灾难之中,廉价,快速的测序时代已经悄然来临
去年八月的一个早晨,在美国东岸的*波疫情出现消退之后,我去拜访了位于曼哈顿下城的纽约基因组中心,去观察基因测序的过程。那一天,该实验室的技术人员正在研究从新泽西州哈肯萨克大学医学中心的患者身上采集到的大量SARS-CoV-2样本。当我到达时,中心实验室经理Dina Manaa递给了我一件蓝色的实验室外套。Manaa说:“我会带你走完整个过程。”在接下来的20分钟的时间里,我们一边在实验室里面走来走去,她则一边给我解释她们的工作。
对病毒进行测序非常费劲,整个过程跟通过脸颊拭子或一滴血中对人类DNA进行测序很像。样本其实是沿着装配线流动的:在非常敏感的“秤”上“称重”,去测量样本质量;然后浸入到叫做试剂的化学溶液了;再用“条形码”对遗传物质进行标记,从而可以分别跟踪每一个样本。Manaa解释说,大多数的准备工作都跟检测病毒样品质量,然后把其中的遗传物质放大有关,其实就是把从拭子提取的少量看不见的冠状病毒转化为大量的DNA,所有这些都是为了读取和分析做的准备——她们有专门用于此目的的设备。
在另一个实验室里面, Manaa在5个一排完全一样的新机器面前驻足了一会儿,这就是Illumina NovaSeq 6000(或者她们所谓的Nova—seeks”)。这跟六个月前中国首次对病毒进行测序使用的机器类似。NovaSeqs大概像办公的复印机那么大,除了有一块大的触摸屏,以及从设备背面伸到天花板的通风管以外,几乎没有什么显著特征。每台机器的成本约为100万美元;现在全世界大约有1000台。在实验室工作台边上,技术人员Berrin Baysa正在将微量的含有病毒的透明溶液从一个试管转移到另一个试管,并把混合物移到一个小型旋转离心机上。经过近两天的准备之后,这批Hackensack样本终于走到了最后一步。Baysa把她制作的这些小鸡尾酒混合到一起,将它们倒入所谓的流通池里面,其实就是一个跟iPhone大小差不多,含有4个中空室的平板玻璃盒。然后,她小心地把流通池塞进NovaSeq 6000的抽屉插槽里面。
往触摸屏输入了一些指令然后点击“开始”之后,她说:“好了,让我们为成功祈祷吧。”她交叉起自己的手指,祈祷起来。
她说,对于这项特殊任务,机器需要两天才能完成读取工作。这意味着届时病毒的完整基因序列将准备就绪,可供“生物信息学家”寻找样本的模式和变异。
NovaSeqs代表着二十年左右技术发展的*。这项技术在很大程度上始于人类基因组计划(2003年完成,主要由NIH资助)。该项目表明,人类的基因组(也就是NIH所谓的“构成人类的完整基因蓝图”)由约30亿个“碱基对”组成。这些是键合化学物分别用A,C,G和T进编码,其中A代表腺嘌呤,C代表胞嘧啶,G代表鸟嘌呤,T代表胸腺嘧啶。这些碱基对会频繁在我们的染色体上进行组合,构成约30000个信息稠密的字符串,或簇。簇就是我们的基因。
人类基因组计划耗时13年,耗资超过30亿美元。Jeffery Schloss多年来一直在NIH的分支机构美国国家人类基因组研究所(National Human Genome Research Institute)工作,负责对技术拨款进行监督。他告诉我,2002年,他参加了一次会议,会上大家探讨了测序的未来。Schloss回忆说:“对人类基因组进行测序是一项巨大努力,但我们知道这只是我们要做的事情的开端,而这意味着测序必须做出激烈改变。在那次会议上,有人提出了一个疯狂的想法:要是一千美元就能对一个大型基因组进行测序会怎样?这能够开启什么样的局面?”