生物技术|斯坦福AI 5小时DNA测序破世界纪录!创人类新里程碑,成本仅3万( 二 )


还有一名13岁的心衰竭患者,其症状曾被误诊为新冠肺炎 。研究团队也在数小时内标定了导致其心肌异常的基因变异,让他在21天内换上了健康的移植心脏 。
论文作者之一、博士后约翰·果津斯基在个人推特上说,「这将完全改变危重病人确诊遗传病的现有方式,为医护业带来以前只有梦见的新标准 。」
成本低至3万在确定患者1的诊断之后,科学家便更新了生物信息学框架,将原始信号数据实时传输到云存储中,并将数据分布到多台云计算机上,以实现接近实时的样本呼叫和对齐 。
这一步将测序后运行时间减少了93%。
在有的病例样本处理过程中,研究团队的平均基因测序速度达到了每分钟1.8G数据的速度,也就是1分钟45秒内测完一个人体基因组,这是前所未有的速度 。
生物技术|斯坦福AI 5小时DNA测序破世界纪录!创人类新里程碑,成本仅3万
文章图片

12名患者诊断过程每个阶段花费的时间
提速需要更新硬件 。斯坦福大学的测序小组使用了牛津纳米孔技术公司制造的一种新机器,该机器带48个测序单元,也称为流动槽 。
斯坦福研究团队的新方法是在使用新分析机时,用所有流动槽同时处理同一个病患的样本 。
这种极限运行方法获得了大成效 。老实说成效差点太大 。每小时173-236G的数据量、94%的比对认定率、最高超过60倍的显子组覆盖度(对显性常染色体数据的读取次数),增强到让处理数据的电脑不堪负荷 。
生物技术|斯坦福AI 5小时DNA测序破世界纪录!创人类新里程碑,成本仅3万
文章图片

斯坦福大学研究生 Sneha Goenka 为此找到了一个快速的解决方案 。这个方案放弃传统的全用本地测序芯片处理数据的办法,直接将编译好的数据存入基于英伟达 Tensor Core GPU与谷歌云的存储系统 。
利用云计算系统,算力可以被放大,并在数据中进行实时筛选 。
然后研究者使用英伟达的Clara Parabricks架构,独立运行为此定制的特殊决策树算法,以扫描输入的样本基因代码中,是否有病原体特征、可能导致疾病的遗传异常特征,并为之标出权重 。
英伟达的Clara Parabricks架构是以GPU加速运行的谷歌PEPPER-Margin-DeepVariant管线版本 。PEPPER-Margin-DeepVariant管线由谷歌与加州大学桑塔克鲁兹分校联合开发,利用递归神经网络算法分析基因测序数据 。
生物技术|斯坦福AI 5小时DNA测序破世界纪录!创人类新里程碑,成本仅3万
文章图片

决策树算法过程
最后研究者将病患样本的基因异常对照致病基因的公开数据库,得出诊断 。
因为软硬件的增强,研究团队还选用了以前更花钱且更艰难的长读测序法 。
传统的基因测序将样本基因分切成小段,然后再测定每段里的DNA碱基对 。如此方式可以在旧技术限制下降低成本与工时,但容易误测或漏测在长段DNA序列中才能完整呈现的变异 。
长读测序不需要过分切割DNA,同时测定1万到10万个碱基对之间的DNA长序列,能在提高测序准确度的同时,提供更多基因变异的细节数据 。
生物技术|斯坦福AI 5小时DNA测序破世界纪录!创人类新里程碑,成本仅3万
文章图片

在之前的旧技术限制下,长读测序的成本远高于传统测序 。
现在速度提升了,精度增加了,那么这次测试究竟花了多少钱呢?

推荐阅读