对特定DNA片段的碱基序列进行分析的基因测序,可以用来诊断疾病,也可以用于疾病风险的预测。可以说这次全球新冠疫情的反击战,就是从中国科学家公布新冠病毒的基因序列开始的。这项技术对于识别和跟踪新冠病变异也发挥着关键的作用。随着测序的价格已经便宜了1000万倍,质量提高了100000倍,业内人士正在展望一个新的技术范式正在到来,我们即将进入一个不断监测身体和周围一切事物的遗传信息的未来。《纽约时报》杂志特约作者Jon Gertner聚焦了基因测序这个新的平台技术的最新进展,并为我们描绘了一个测序与诊断等同的未来世界。原文标题是:Tracking the Covid Code。篇幅关系,我们分三部分刊出,上篇文章为基因测序不再允许人体有秘密(一),此为第二部分。
划重点:
基因测序可以让我们更深入地了解整个人群或国家的健康或疾病标记
基因测序正变得更快更便宜:一夜之间就可完成有30亿个碱基对的基因组的测序,而且成本有望突破100美元
我们将朝着实现针对个人遗传优势和弱势量身定制个性化医疗和生活方式的计划迈出重要的一步
Schloss圈子里面大多数的科学家都认为,这可能会给我们带来深刻启示。通过对大量阿尔茨海默氏病患者的基因组进行研究,研究人员可以弄清楚某些基因或基因组合是怎么导致某些人更容易患上这种病的。他们甚至还可以更深入地了解整个人群或国家的健康或疾病标记。测序可能还会找到基础科学以外的用途——比方说,对产前检查,或对已知会增加某些癌症可能性的基因进行常规性的临床扫描。
在大约15年的时间里,Schloss的机构已为各家初创企业和想法投资了2.2亿美元。其最终目标是要帮助降低全基因组测序的成本并提高测序速度。就算1000美元完成基因组测序仍然遥不可及,但新一代的机器也可能即将面世。Schloss回忆说:“目前还不清楚他们当中的任何一个实现商业化还要花多长时间。但他们必须在商业上取得成功。一切都还不确定。” 确实,2000年代初成立测序初创企业在市场化方面很多最终都失败了。但是,也有少数公司被纳入到其他公司的核心技术当中。比方说,Solexa这家公司就提出了一些具有*性的想法,也就是所谓的“合成测序”(sequencing by synthesis,用光学方法来测量基因样本,也就是用荧光染料来突出样本的DNA元素。该公司最终被Illumina收购,而后者很快就成为这一行业的*。
设备的改进,主要是依赖1970年代由诺贝尔奖得主弗雷德里克·桑格(Frederick Sanger)发明的桑格测序流程的大学实验室感受到了这方面的影响。桑格测序这项颇费功夫的技术涉及到用凝胶电泳把DNA样本分开。1990年代,牛津大学的科学家也是靠这项技术来进行研究的。2000年代初期,威斯康星大学麦迪逊分校病毒学家Dave O'Connor也使用了这项技术,当时,他正在跟实验室合作伙伴Tom Friedrich一起跟踪病毒突变。O'Connor说:“HIV基因组大概有10000个字符。”也就是说要比人类基因组(约30亿个字符)或SARS-CoV-2基因组(约30000个)更简单。“刚刚开始对艾滋病毒基因组进行测序时,我们一次可以坚持几百个字符。”不过O’Connor说,随着新的测序仪的出现,他的工作也发生了变化。到2010年左右,他和Friedrich一天就可以对500000个字符进行解码。几年后,这个数字变成了五百万。
到2015年时,改进的节奏已经到了令人叹为观止的地步。纽约基因组中心负责人Tom Maniatis说:“我还在当博士后研究员的时候,就是在桑格的实验室工作的。当时我必须对大约35个碱基对的DNA进行测序,而这花了我一年的时间。而现如今,你可以在一夜之间就完成有30亿个碱基对的基因组的测序。” 此外,成本的下降也令人惊讶。Illumina在2014年就实现了1000美元的基因组测序。去年夏天,该公司宣布其NovaSeq 6000只用600美元就可以对整个人类基因组进行测序。当时, Illumina首席执行官deSouza告诉我说,公司实现100美元基因组测序之路并不需要突破,只只需渐进性的技术改进即可。他说:“在这一点上,我们不需要奇迹。” Illumina包括华大基因在内的几个竞争对手表示,他们很快也将实现100美元基因组测序。跟我交谈过的业内人士预测这可能只需要一两年的时间。
这些数字并不能完全解释清楚速度更快价钱更可负担可能会意味着什么。但是在医疗保健领域,(也许是从出生开始就进行的)廉价的全基因组检测的发展前景表明,我们将朝着实现针对个人遗传优势和弱势量身定制个性化医疗和生活方式的计划迈出重要的一步。Maniatis说:“一旦走那一步,那将会是你能拥有的最强大,最有价值的临床测试,因为这是你一辈子的记录。” 你的完整基因组在你的一生当中都不会改变,所以只需要测序一次即可。而且Maniatis认为,随着临床研究不断积累新的信息,拿到新研究结果的医生可以重新评估你的基因组,也许他们会发现,比方说,你35岁时的基因突变到了50岁就会成为问题。他说:“真的,那不是科幻小说。我个人非常肯定,这一点即将实现。”
从某些方面来说,其实这件事也已经开始了,哪怕是在公共卫生危机当中。今年1月,纽约基因组中心开始跟威尔康奈尔医学中心与纽约长老会医院建立合作关系,对数千名患者进行全基因组测序。威尔康奈尔医学中心项目负责人Olivier Elemento告诉我说,其目标是了解基因组全序列(而不仅仅是识别少数遗传特征)可以如何为诊断和治疗提供依据。根据患者基因组,*的药物是什么?理想剂量是多少?Elemento解释说:“我们正在尝试解决一个非常重要的问题,一个在这样的规模上从来没有得到过解答的问题。那就是全基因组测序有什么用?” 他说,他相信在一两年内,这项研究将会得出答案。
测序的*希望一部分来自于我们的基因是确定性的,并且通过了解我们的DNA编码,我们也许可以刻画自己的命运。2000年,当对人类基因组的早期解读被公布出来时,比尔·克林顿总统指出,我们正在瞥见“有史以来人类制作的最重要,最奇妙的地图之一。”但是这张地图往往被证明很难解读,它的路线是不清楚的。过去20年已经证明,遗传基因只是一套令人困惑、难以解释的系统的一个方面。比方说,使用基因疗法治疗疾病的进展一直停滞不前。直到去年,医生们才成功治疗了几例有遗传性镰状细胞性贫血基因的患者。与此同时,科学家们意识到了还有其他一些因素:环境和生活方式因素复杂的叠加,以及我们的微生物群,似乎对健康、发育和行为产生了相互关联的影响。
尽管如此,在过去一年的时间里,对基因组测序的一些特别期望的确成真了,但却是出于预期以外的原因。去年夏天和秋天,我有很多机会跟Illumina及其在英国的竞争对手Oxford Nanopore的高管进行交谈。很显然,疫情意味着他们业务要遭遇重大的中断,但是这些公司的高管都把这种情况视为自己的机遇。基因组测序可以实时为我们的疫情处置决策和行动提供信息,这是有史以来的*次。
从一开始,基因组流行病学(“gen epi ”)社区就知道,随着SARS-CoV-2病毒的复制和传播,这种病毒每隔几个星期就会形成新的变体;有一点很快就很清楚了,那就是它的基因组的那30000个碱基对字母每次可以产生一个到多个改变(或突变)。基于这一洞察见解,2020年1月19日,也就是向世界公布病毒代码仅仅过了一周之后,科学家就可以看到中国分享的12个完整病毒基因组,并得出结论认为它们几乎完全相同,这意味着大约在同一时间内有12人被感染,而且几乎可以肯定是人传人的。
当Bedford的实验室开始在西雅图研究病毒基因组时,他可以更进一步。到2月下旬时,他得出的结论是,他看到的新病例已经不只是输入性的了。基于对当地突变的观察——先后发现(间隔为六个星期)的两个菌株看起来太相似了,到了不可能是巧合的地步——说明本地已经出现了社区传播。2月29日, Bedford在Twitter上发了一条令人不寒而栗的帖子:“我认为华盛顿州已经爆发大规模疫情,但直到现在还没检测到。”他的证据就在基因代码当中。
在全球众多开始跟踪这种病毒的演变并在放到全球数据库共享的实验室当中,Bedford的实验室是其中之一。与此同时,基因组流行病学研究人员也在用测序开展本地试验。在2020年春季,一个英国科学家团队比较了从一所医院的患者那里采样到的病毒序列,想看看感染是来自彼此还是来自其他地方的。负责领导这项研究的剑桥大学学术医生Esteé Torok 说:“我们可以实时生成有用的数据。在理想的世界里,你可以每天都可以做到这一点。” 换句话说,测序技术相比几年又有了发展——在当时,科学家可能要在疫情爆发一年后才能发表论文,但现在基因流行病学家可以比较特定位置的突变,然后发出警报——出现了社区传播!3楼的病人正传染给5楼!——并立即采取行动。
从基因组学领域工作的角度看着疫情的发作,既让人看到了新的测序工具的惊人威力,又让人看到了美国公共卫生系统未能充分利用它们的灾难性失败。去年7月底,美国国家科学院发布了一份报告,指出基因组测序的进步可以让我们具备“打断或延迟病毒传播,从而降低发病率和死亡率” 的能力。但是这项报告同时严厉地指出,新冠病毒的测序工作是“很不令人满意,往往是被动的,反应性的,缺乏协调且资金不足。” 我交谈过的每一位科学家都知道,这种病毒可能会演变出危险的新变种。当时距离传播性致命性更强的B.1.1.7新冠病毒变异株的出现还有好几个月的时间。对于美国在追踪感染途径方面的测序工作正在走向失败,研究人员也表达了类似的担忧。
拜登政府延缓疫情流行的办法之一是投资2亿美元对那些检测呈阳性的人的病毒样本进行测序。在1.9万亿美元的“美国救助计划”最近获批之后,17.5亿美元会拨给美国疾病控制与预防中心,以支持基因组测序和疾病监测。
今年1月下旬的时候,美国疾病预防控制中心(CDC)开始向全国各地的公共卫生实验室提供资金,以支持已经在学术实验室开展的测序工作。不过,这项工作开始的基准很低。据《华盛顿邮报》的测算,就疫情期间测序的采用情况而言,美国在全球排名为第38位。截至2月中旬,美国仍在努力追赶许多的欧洲和亚洲国家。所以,现在还不能说美国已经没有新的或危险的变异出现。只能说我们不知道。