您所在的位置: 首页>>存储频道>>存储新闻>>

EMC加码重复数据删除技术

http://stor.51cto.com  2007-11-23 10:20  旷文溱  CNETNews.com.cn  我要评论(0)
  • 摘要:所谓的重复数据删除技术,意指扫描作业服务器(production)磁盘数据,判断数据是否为“重复”或“冗余”。原理是以算法切割磁盘里的数据成为 区块(Block)或是区段(Segment),并为每一个分割单位求出一个特征值(unique ID),即可以代表此区块的数据。
  • 标签:索引  Networker  持续数据保护  CDP  Avamar  重复数据删除  EMC

今年将重复数据删除技术列为备份软件要项的EMC,再宣布延伸前者的产品线内容。

EMC昨(20)日宣布,该公司既有的备份软件NetWorker,将加入由收购Avamar取得的重复数据删除技术(Data De-duplication),而NetWorker亦将支持自家的持续数据保护(CDP, Continuous Data Protection)技术RecoverPoint,令企业用户仅使用单一数据备份软件,即可整合多种功能。

所谓的重复数据删除技术,意指扫描作业服务器(production)磁盘数据,判断数据是否为“重复”或“冗余”。原理是以算法切割磁盘里的数据成为 区块(Block)或是区段(Segment),并为每一个分割单位求出一个特征值(unique ID),即可以代表此区块的数据。

藉由这个特征值,系统就可以比对硬盘中已有数据新写入数据之间,是否具有相同之处。若是一致,即代表这笔数据为重复写入,系统便只会为这份数据留下一个索引(index),而不会重复储存占有磁盘空间。换言之只有特征值不同的数据才会被实际写入硬盘。

值得注意的是,NetWorker并非该公司首款支持重复数据删除技术的备份软件。该公司的Centera亦具有此功能。对于两者的功能区隔,EMC软件事业处资深技术经理蓝基能表示,Centera强调的系长期保存,安全层级更高;但是NetWorker的重复数据删除技术更为精细。

他举例道,两者虽然都能设定政策,规定数据必须在一定年限后才能删除,但是Centera能做到的是,未达年限一定无法进行修改、删除;NetWorker则相反,即便未达规定年限,也能由管理人员手动删除。而Centera是档案层级的重复数据删除;NetWorker则是子档案(sub-file)层级。

换言之,如果一个档案是10MB的大小,其中只要有50KB的异动,NetWorker都能侦测到,然后备份到那50KB。而Centera则可能将该档案视为重复数据,未予备份。

EMC指出,重复数据删除技术能将每日备份数据量减至300分之一,备份时间则可减少至10分之一。对于拥有5TB以上的备份数据量、集中在档案等非结构性数据的企业尤其适用。NetWorker将自7.4.1的版本开始提供重复数据删除技术和持续数据保护功能。现已开始提供给客户。

【返回新闻首页】

【责任编辑:常疆 TEL:(010)68476606】

重复数据删除技术
思科Networkers2006大会
数据库之索引与查询
虚拟存储管理与应用
固态硬盘(SSD)开疆扩土
 
 验证码: (点击刷新验证码)   匿名发表
  • Visual C++ 完全自学宝典

  • 作者:强锋科技,朱洪波
  • Visual C++ 6.0是微软公司为程序人员提供的Visual Studio 6.0工具套件中的重要组成部分。本书由浅入深地介绍使用Visual C++ 6.0..
Copyright©2005-2008 51CTO.COM 版权所有