LOADING...
LOADING...
LOADING...
当前位置: 玩币族首页 > 行情分析 > DNA存储——存储材料的变革者

DNA存储——存储材料的变革者

2020-06-19 BMJ分布式存储 来源:火星财经

根据Domo的数据,2020年每分钟,谷歌进行400万次搜索,用户在YouTube上观看了433万段视频,发送了204,000,000封电子邮件,发了27万次推特,在Instagram上发布了21万张照片。到 2021年,全球人均每秒将创造约 1.7 兆字节的数据,假设世界人口为 78 亿,一年可创建约 418 ZB(4180 亿 个1TB 硬盘的信息价值)。目前的磁性或光学数据存储系统通常不能持续超过一个世纪,此外,运行数据中心需要大量能源。简而言之,我们即将遇到严重的数据存储问题,随着时间的推移,这个问题只会变得更加严重。


1.DNA存储时间长

基于 DNA 的数据存储,DNA由核苷酸A、T、C、G的长链组成,是生命中的信息存储材料。数据可以按这些字母的顺序存储,将DNA转化为一种新的信息技术形式。它已经可以常规地排序(读取),合成(写入),并轻松地准确地复制。DNA也非常稳定,远古的化石样本完全基因组测序就证明了这一点,储存它不需要太多的能量。

2.DNA存储容量大

DNA可以用远远超过电子设备的密度来储存大量数据。例如,根据哈佛大学乔治·丘奇(George Church)及其同事在《自然材料》上发表的计算,简单的大肠杆菌的储存密度约为每立方厘米1019位。在这种密度下,目前世界上一年的储存需求可以通过一个大约一米的DNA立方体很好地满足。

3.DNA技术可行性高

DNA数据存储不仅仅存在于理论中,实际的可行性高。例如,2017年,哈佛大学的教会小组采用了CRISPR DNA编辑技术,将人类手掌的图像记录到大肠杆菌的基因组中,这些图像的读取精度超过90%。华盛顿大学和微软研究公司的研究人员已经开发出一种全自动系统,用于编写、存储和读取DNA编码的数据,包括微软和Twist生物科学在内的许多公司都在努力推进DNA存储技术。

与此同时,DNA已经被用来以不同的方式管理数据,研究人员正在努力理解大量的数据。下一代测序技术的最新进展使数十亿个DNA序列能够同时轻松读取。有了这种能力,研究人员可以使用DNA序列作为分子识别"标签"来跟踪实验结果。

目前存在的挑战是DNA数据存储成本较高,读取和写入的速度并不能支持大规模商用。几乎可以肯定的是DNA会用于以全新的尺度生成信息,并长期保存某些类型的数据,促进整个存储工业的发展。

近日,北卡罗纳州立大学(North Carolina State University,以下简称NC)的研究人员开发了一种全新的DNA数据存储系统方法,使用户能够读取或修改数据文件,而不会破坏它们,并使系统更易于扩展实际使用。

"大多数现有的DNA数据存储系统依靠聚合酶链式反应(PCR)来访问存储的文件,这在复制信息方面非常有效,但也带来了一些重大挑战,",论文的共同作者Albert Keung说。"我们开发了一种称为动态操作和可重用信息存储技术DORIS(笔者注:DORIS是Dynamic Operations and Reusable Information Storage的缩写),该系统不依赖于 PCR。这有助于我们解决实际实施 DNA 数据存储技术所面临的一些关键障碍,Keung 是北卡罗来纳州立大学化学和生物分子工程助理教授。

目前的系统依赖于称为引物结合序列(primer-binding sequences)的DNA序列,这些序列被添加到存储信息的DNA链的末端。简而言之,DNA的引物结合序列用作文件名。当您需要文件时,您可以检索带有该序列的 DNA 链。

DNA 数据存储技术的许多实际障碍都围绕着使用 PCR 来检索存储的数据。依赖PCR的系统必须大幅度提高和降低存储的遗传物质的温度,以便将DNA双链撕开并显示引物结合序列。这导致所有的引物结合序列和数据存储序列自由地混在“基因汤”中。现有技术可以对基因混合物进行排序,以便使用 PCR 查找、检索和复制相关的 DNA。温度波动对于开发实用技术来说是个问题,PCR 技术本身逐渐消耗正在检索的文件的原始版本。

DORIS采取了不同的方法。DORIS不使用双链DNA作为引物结合序列,而是使用由单链DNA组成的"悬空"——就像一条尾巴,它系在实际存储数据的双链DNA后面。虽然传统技术要求温度波动撕开DNA以找到相关的引物结合序列,但使用单链游离意味着DORIS可以在不干扰双链DNA的情况下找到适当的引物结合序列。

论文的共同作者、NC电气和计算机工程教授詹姆斯·塔克(James Tuck)表示:"换句话说,DORIS可以在室温下工作,这使得开发在真实场景中的DNA数据管理技术更加可行。

不必撕开DNA链的另一个好处是,悬垂中的DNA序列可以与在数据文件的双链区域找到相同的序列。在不牺牲信息密度的情况下,基于 PCR 的系统很难实现这一点,因为系统无法区分引物结合序列和数据存储序列。

论文的第一作者、NC博士生Kevin Lin说:"DORIS使我们能够显著提高系统的信息密度,也使得处理大型数据库变得更加容易。

一旦DORIS确定了正确的DNA序列,它就不会依靠PCR来复制。相反,DORIS将DNA转录为RNA,然后通过反向转录来读取的数据存储系统DNA。单链悬垂也可以修改,允许用户重命名文件、删除文件或"锁定"文件,从而有效地使其他用户看不到这些文件。

存储材料科学一直处于变革之中,随着时间的推移,数据存储的需求增长,一批批新的存储材料将会应运而生,一家家基于数据存储的企业也会如雨后春笋破土而出。

BMJ一直致力于前沿科技的研究,2020年投资3000万成立了分布式存储产业基金,投资50个数据研究中心,用于分布式存储相关的技术研究。2021年在全球成立30家分布式存储实验室,主要做存储材料相关领域的技术研究。

BMJ分布式存储,为存储而来,为服务而生。

笔者注:

PCR:(Polymerase Chain Reaction),聚合酶链式反应是一种用于放大扩增特定的DNA片段的分子生物学技术,根据DNA 双螺旋结构双链互补的特性,通过ATCG碱基对在短时间内大量复制生成,形成DNA长链。

参考文献:https://news.ncsu.edu/2020/06/dynamic-scalable-dna-data/

相关文章:链接文字

本文来源:BMJ分布式存储
原文标题:DNA存储——存储材料的变革者

—-

编译者/作者:BMJ分布式存储

玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。

LOADING...
LOADING...