左边是戴尔PowerStore中端存储,可实现4:1的数据缩减率。右边是戴尔PowerProtect DD备份存储,可实现65:1的数据缩减。同样用来“存数据”为什么数据缩减率差别这么大?这个问题,相信很多企业级的小伙伴和我有一样的疑问。
相对于备份存储动辄达到50:1、65:1的数据缩减比例,而主存储往往只有“可怜”的3:1,4:1。难道是备份存储所使用的数据重删、压缩算法更先进,更高效?
如果是算法导致,为什么不用在主存储上?这对于寸金寸“容量”的存储设备来说,所带来的经济效益实在太诱人了。
而要回答这个问题,我们得先知道什么是重复数据删除技术和数据压缩技术。
重复数据删除技术是指仅在存储介质上保留数据的一个唯一实例,冗余数据被替换为指向唯一数据副本的一个指针。当两个或多个文件具有相同的内容时,重复数据删除会将文件分成多个段,仅存储每个唯一文件段的一个副本。
而数据压缩技术是指在不丢失有用信息的前提下,缩减数据量以减少存储空间,从而提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。
一图看懂数据重删和压缩
影响数据缩减率的因素有哪些?
答案是虽然主存储和备份存储都以存储数据为目的,但两者对于数据缩减技术有着完全不同的考量。
首先,数据缩减是备份设备的核心功能,提供更高的数据缩减率,是这类产品的主要诉求。
而对主存储来说,数据缩减只是附加功能之一,而为了避免数据缩减产生大量的计算资源占用,影响到业务应用的读写,因此在数据缩减的使用上,往往有许多顾虑与限制。
另一方面,备份设备也因为自身的高比率数据缩减功能,使其也被局限在备份、归档这类静态的存储应用,而不适合需要频繁读取与写入的一般业务应用。原因有以下两点:
▶第一,高比例的数据缩减会占用大量的计算资源,从而影响其他业务应用,因此很难在运行数据缩减的同时,还能正常提供一般的读写服务。
▶其次,经过重复数据删除或数据压缩技术处理过的数据,必须先还原成原始数据,才能供前端主机读取与使用,而主存储中的数据,往往是那些需要频繁读取的活跃数据。
因此,以占用系统资源的方式频繁地缩减与还原数据,是无意义的,也是资源的浪费。
此外,影响数据缩减率的另一个因素是,它取决于你有多少相同或相似类型的数据:
●数据保存期设置:数据保存的时间越长,重复数据删除引擎发现重复数据的可能性也越大。
●数据类型:一些数据天生比较容易出现重复。如果网络里存在大量的Windows服务器,或者VMware虚拟机,就有希望得到更高的数据缩减率。
●变化速率:数据变化的速率越低,发现重复的机会也就越高。
●数据备份策略:全备份(相对于增量备份和差异备份)的频率越高,数据缩减的潜力也就越大,因为每天的数据有大量的重复。
可以看到,由于归档和备份系统的数据,大部分都是冗余数据,因此天生就可以实现更高的数据缩减率。
最后,是技术问题
比如戴尔PowerProtect DD备份存储拥有高达65:1的数据缩减率,放眼业界同类产品都是顶尖的存在,这就源于其独有的数据缩减专利技术。
而戴尔PowerStore虽然“只有”4:1的数据缩减率,但其数据缩减功能是“始终可用”。意味着PowerStore在数据缩减时不会额外占用控制器的CPU资源,几乎对性能不会产生影响。
这也让企业用户不再陷入性能下降与节省成本的两难,而让数据缩减在主存储真正发挥了用武之地。
戴尔PowerStore采用英特尔®至强®可扩展处理器,该处理器可以优化工作负载,可靠性强,还有高计算力、高稳定性和高效敏捷性,不仅帮助PowerStore轻松满足既定工作负载,也可以为数字化变革做好准备。
最后,总结一下。为什么备份存储与主存储的数据缩减率差别巨大?
答案是两种产品的设计思路不同,存储数据的类型不同,因而不能直接进行数据缩减率的比较。
戴尔服务器R750,R750XS,R750XA主要有什么区别?各主要用途是什么?
也许2022全球超级计算大会上最激动人心的事情之一就是戴尔的新平台。Dell PowerEdge XE9680 终于让该公司能够为其客户提供合法的高端人工智能培训平台。在2022全球超级计算大会的一个发着蓝光的角落里,巨大的系统展示给所有人看。
戴尔正在推进其AMD EPYC服务器计划。它现在提供5个支持 Gen3 EPYC CPU 的 PowerEdge 机架型号,并且正在审查的最新 R7525 提供了令人难以置信的配置支持。
在专门针对VDI优化的2U双路平台中提供加速器卡、存储和计算能力的卓越组合,最大限度地提高应用程序性能。【企业级主流服务器,一机多用】
Dell PowerEdge T440服务器适用于:WEB、文件共享、财务ERP、数据库、虚拟化存储。利用性能、容量和I/O选项满足您的独特需求
戴尔PowerEdge T640是一款用途广泛的高性能服务器,非常适合服务器虚拟化、桌面虚拟化、ERP、CRM、HPC、数据中心等。
PowerEdge M640 是一款针对密度进行了优化的半高刀片式服务器,旨在实现高性能和高效率。它非常适合 XaaS、私有云和 HPC 应用程序。
专为Web托管和多用途应用程序而设计的入门级1U机架式服务器。流畅运行ERP软件,文件共享,财务系统,数据保护等各种应用。
Dell PowerEdge T340塔式服务器,可靠运行、轻松管理并扩展业务。适合关注协作和文件共享且配有远程办公室的成长型企业。
戴尔PowerEdge T140,易于使用、安全且实用的入门级服务器,适用于成长型企业。非常适合文件和打印以及销售点应用程序。
Dell EMC PowerEdge R7515 是一款单插槽 2U 服务器,专为处理软件定义的存储、虚拟化和数据分析等工作负载而设计。【按需定制,下单享好礼】
Dell EMC PowerEdge R6525 是一款具备高性能和创新功能的双插槽 1U 服务器,可处理 HPC、VDI 和虚拟化等工作负载。【现货库存、按需定制】
Dell EMC PowerEdge R7525 双插槽 2U 机架式服务器,能够提供强劲的性能和灵活的配置。可处理高性能计算HPC、VDI 和虚拟化等工作负载。
Dell Unity XT 380 是 Dell Unity XT 混合闪存阵列系列的入口点。它专为多云部署而构建,提供简单且价格合理的统一存储,旨在提高性能和效率,并在所有数据池中实现在线数据减少,并且能够运行不需要性能和延迟的通用工作负载NVMe 架构,处理内联数据缩减,并提供不影响性能的数据服务。
使用 Dell Unity XT 480 混合闪存阵列处理各种通用工作负载。这个统一的存储平台平衡了闪存的性能和磁盘的经济性,能够同时运行不需要 NVMe 架构的性能和延迟的混合应用程序工作负载,处理内联数据减少,并提供不影响性能的数据服务。
使用 Dell Unity XT 680 混合闪存阵列覆盖广泛的通用工作负载。该统一存储平台专为多云部署而构建,平衡了闪存的性能和磁盘的经济性,能够同时运行不需要 NVMe 架构的性能和延迟的混合应用程序工作负载,处理内联数据减少,并提供对性能没有影响的数据服务。
Dell Unity XT 880 混合闪存阵列平衡了闪存的性能与磁盘的经济性,能够同时运行不需要 NVMe 架构的性能和延迟的通用用途,处理内联数据减少,并提供无性能的数据服务影响。
Dell Unity XT 380F 全闪存阵列是 Dell Unity XT 全闪存存储系列的入口点。它专为多云部署而构建,提供简单且价格合理的统一存储,专为高性能和低延迟而设计,能够同时运行混合应用程序工作负载、处理内联数据缩减,并提供不影响性能的数据服务。