创客联盟网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

开思网在线3D打印服务
查看: 10646|回复: 0
打印 上一主题 下一主题

微软DNA储存技术能将沃尔玛大小数据库压缩成方糖大小

[复制链接]
跳转到指定楼层
楼主
发表于 2016-4-12 17:22:00 | 只看该作者 |只看大图 回帖奖励 |正序浏览 |阅读模式

马上注册(开思网用户可以直接登录),结交更多创客好友,享用更多功能,让你轻松玩转创客社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
生命的繁衍诞生了神奇的DNA,无数的基因和生命活动信息都能够通过DNA来进行延续和传承,那么随着技术的发展,DNA除了储存生物遗传信息之外能不能用于人类的数据存储呢?

据外媒报道,微软和华盛顿大学人员已经成功研发了利用人工合成DNA作为数据存储介质的技术。研究人员表示,如果这一技术如果能够运用到主流应用中去,那它将成为当今存储密度最高的存储设备。研究人员表示,像沃尔玛超市般大小的数据中心,通过DNA作为储存介质的即可能“瘦身”到一块方糖大小。

DNA存储密度惊人
研究团队成功地将4个图片文件的数据编码为人工合成DNA片段的核苷酸序列。更重要的是,他们能实现逆过程——从更大的DNA池中取回正确的核苷酸序列,重建图像,而且没有丢失1个字节的信息。另一项试验涉及对视频文件的编码和读取。

DNA存储技术
华盛顿大学计算机科学和技术副教授、论文共同作者路易斯·塞兹(LuisCeze)在一份声明中表示DNA能够非常“高效、紧凑、耐用”地储存生物信息。如果我们将把DNA用于数据存储——图像、视频、文档,保存时间可以长达数百或数千年。
DNA存储技术研究进展神速
对DNA数据存储技术的研究进展神速。1999年,研究人员利用DNA存储技术编码和恢复了一条长23个字母的信息。到2013年,欧洲分子生物学实验室-欧洲生物信息学研究所的科学家,把美国黑人运动领袖马丁·路德·金(MartinLuther King)《我有一个梦想》演讲的mp3文件编码在DNA中。
研究人员在发表在《自然》上的论文中称,这种编码方法使得约一杯DNA能存储至少1亿小时的高清视频。
据英国研究人员称,存储在DNA链中的数据能保存数万年。


在DNA存储技术中,读取DNA相对简单,主要障碍在于写DNA。DNA存储技术存在两个难点:其一,目前的方法只能合成短链DNA;其二,写和读DNA都容易出错。
微软和华盛顿大学研究人员称,他们已经开发了“一种新颖的方法”,把数据中的“1”和“0”字符串转换成DNA序列中的4种碱基——腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。
为了访问存储的数据,研究人员在DNA序列中编码了相当于邮政编码和街道地址的寻址信息。聚合酶链反应(以下简称“PCR”)技术帮助研究人员更轻松地识别他们需要查找的“邮政编码”。
研究人员然后利用DNA测序技术,“读取”数据,并通过利用“街道地址”对数据进行整理,将数据恢复成原来的视频、图像或文档。
研究人员表示,“DNA是一种有吸引力的潜在数据存储介质”,理论上其存储密度比磁带高出8个量级,一个可以拿在手里的磁带盒存储容量高达185TB。
微软和华盛顿大学研究人员也证实了人工合成DNA的“长寿”,称即使在恶劣环境中其半衰期也超过500年,磁带保存时间为10-30年,硬盘为3-5年。
还不够完美
美国研究人员强调了提高存储密度的紧迫性。市场研究公司IDC和存储设备厂商EMC在《The DigitalUniverse》研究论文中称,到2020年,包含在全球计算机、历史档案、电影、照片、企业系统和移动设备中的数据量将达到44万亿GB,“是2013年的10倍。尽管并非所有信息都需要保存,但世界生成数据的速度快于存储容量的增长”。
要进入商用阶段,DNA存储系统还有一些问题需要解决。首先是DNA合成和测序还远不够完美,DNA存储系统的一个关键部分是开发一种适当的编码技术,通过增加冗余度提高容错能力。
其次,DNA存储系统中随机存取数据还是个问题,读取延迟远长于写入延迟。目前的技术只能批量读取数据,即使只从存储系统中访问一个字节的信息,系统也必须对整个DNA池进行测序和解码。

把数据编码为DNA序列
研究人员已经提出了改进随机数据存取的方法,即利用PCR只扩增希望读取的数据,并对相应的DNA序列测序。这种方法既能提高数据读取速度,也无需对整个DNA池进行测序。
塞兹称,“这是我们在数据存储方面向大自然学习的一个范例。”
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 支持支持
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|创客联盟网  

GMT+8, 2024-11-25 23:04 , Processed in 0.017139 second(s), 11 queries , Gzip On, Redis On.

Powered by Discuz! X3.3

© 2002-2024 www.iCAx.org

快速回复 返回顶部 返回列表