通过编码转化,“碱基四进制”和“计算机二进制”就可以实现“对话” 。天津大学合成生物学前沿科学中心博士生韩明哲解释说,壁画的数字图像本质上就是二进制的比特串,“我们通过编码将这些二进制的比特串,转化为四进制的ATGC碱基序列,再通过DNA合成技术将碱基序列写入DNA中,壁画的数据图像就‘变’为DNA了 。”
此前,该团队成功在酿酒酵母中合成了一条额外的人工染色体,并在上面存储了两张图片及一段视频信息,将其称之为“酵母CD” 。随着酵母的不断繁殖扩增,数字信息也随之廉价且稳定地复制 。
“我们传代培养酵母到100代,依然可以完美地恢复出原始数据 。”元英进说,假如脑洞更大一点,将信息存储到一棵树中,随着树生长千百年,人类的子孙后代都可以随时从这棵树中读取到千百年前存储的信息 。
这一次,这支年轻团队的创新之处在于,能实现更恶劣条件下可靠读取信息 。韩明哲说,存了壁画信息的DNA,本质上其实跟天然的DNA没有什么不同,同样也存在长时间存放而产生的断裂和降解等问题,影响信息存储的长期可靠性,这也成为亟待解决的关键科学问题 。
于是,他们设计了基于德布莱英图理论的序列重建算法来解决DNA断裂等问题,可以从严重降解的DNA样本中,恢复原始的信息 。
为了验证数据的长期可靠性,团队制备了一个没有任何特殊保护的DNA水溶液样本,随后在70℃的温度下加速样本断裂、降解长达十周 。韩明哲说:“这个过程使得DNA片段80%以上都发生了断裂错误,模拟了DNA在自然环境下千年万年的降解情形 。”
随后,团队依靠设计的序列重建算法,依然可以准确组装并解码96.4%以上的片段,再通过一种编码方式解决了少量片段丢失的问题,使原始的敦煌壁画图片能够完美恢复 。
【HP磁带库2024配置手册hp磁带库怎么连接】DNA存储走向实用化还有多远
尽管DNA存储还不被大众所熟知,但它正在努力走出实验室,“距离实用化并不遥远 。”元英进说,惊人的数据存储需求是新技术走向市场的最大推动力 。
据国际数据公司估计,到2025年全球数据总量将达到175ZB(1ZB为十万亿亿字节) 。到2024年,全球将有30%的数字业务进行DNA存储试验 。然而从目前来看,DNA存储想要大规模应用,尤其是在中国实用化还需要突破几个关键瓶颈 。
团队分析了当前DNA信息存储面临的主要挑战 。信息存储成本高、信息读写速度慢,以及无法高效对接现有信息系统是三大主要限制因素 。
根据测算,目前DNA存储写入成本相当于20世纪80年代内存的存储成本,而要达到当前数据存储成本还需要降低7-8个数量级 。
“DNA信息存储成本在未来有很大下降的潜力 。”韩明哲认为,今后可以从优化合成反应、改良芯片结构、替换廉价耗材、优化试剂分配量等方面着手,大幅降低合成成本 。
与此同时,由于信息存储领域市场规模巨大,随着半导体器件、微纳加工在DNA信息存储领域的应用,该领域的巨大投入将对DNA合成技术产生重大影响,DNA合成技术与装备快速迭代升级,也有望使成本快速下降 。
DNA信息存储的读取依赖测序技术,与磁、光、电等存储相比,读取速度较慢 。目前DNA测序仪的读取速度与硬盘相比,还存在3-4个数量级的差距——现有电、磁存储技术通常每秒可读取几十到几百兆字节数据 。此外,DNA存储的标准尚待建立,面临与现有数字存储系统兼容的问题 。
“DNA信息存储是一个新兴的、多学科深度交叉融合的研究方向 。”元英进认为,DNA存储在未来极有可能成为庞大冷数据存储的主要存储介质 。
推荐阅读
- 诗朗诵技巧与注意的问题诗朗诵技巧和方法 发声
- 狂犬疫苗多少钱一针2023年 狂犬疫苗多少钱一针?被猫抓了
- 国破山河在txt
- 胡麻油正确的食用方法可高温吗
- 纤绳的读音是什么?纤绳的读音是什么意思是什么
- 七夕表白话语简短 七夕表白话语
- 云南的歌会原文 云南的歌会教案设计
- 生命的药方课文 生命的药方阅读答案解析
- 练肩部下沉最好的方法 练肩部下沉最好的方法是什么