左边是戴尔PowerStore中端存储,可实现4:1的数据缩减率。右边是戴尔PowerProtect DD备份存储,可实现65:1的数据缩减。同样用来“存数据”为什么数据缩减率差别这么大?这个问题,相信很多企业级的小伙伴和我有一样的疑问。
相对于备份存储动辄达到50:1、65:1的数据缩减比例,而主存储往往只有“可怜”的3:1,4:1。难道是备份存储所使用的数据重删、压缩算法更先进,更高效?
如果是算法导致,为什么不用在主存储上?这对于寸金寸“容量”的存储设备来说,所带来的经济效益实在太诱人了。
而要回答这个问题,我们得先知道什么是重复数据删除技术和数据压缩技术。
重复数据删除技术是指仅在存储介质上保留数据的一个唯一实例,冗余数据被替换为指向唯一数据副本的一个指针。当两个或多个文件具有相同的内容时,重复数据删除会将文件分成多个段,仅存储每个唯一文件段的一个副本。
而数据压缩技术是指在不丢失有用信息的前提下,缩减数据量以减少存储空间,从而提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。
一图看懂数据重删和压缩
影响数据缩减率的因素有哪些?
答案是虽然主存储和备份存储都以存储数据为目的,但两者对于数据缩减技术有着完全不同的考量。
首先,数据缩减是备份设备的核心功能,提供更高的数据缩减率,是这类产品的主要诉求。
而对主存储来说,数据缩减只是附加功能之一,而为了避免数据缩减产生大量的计算资源占用,影响到业务应用的读写,因此在数据缩减的使用上,往往有许多顾虑与限制。
另一方面,备份设备也因为自身的高比率数据缩减功能,使其也被局限在备份、归档这类静态的存储应用,而不适合需要频繁读取与写入的一般业务应用。原因有以下两点:
▶第一,高比例的数据缩减会占用大量的计算资源,从而影响其他业务应用,因此很难在运行数据缩减的同时,还能正常提供一般的读写服务。
▶其次,经过重复数据删除或数据压缩技术处理过的数据,必须先还原成原始数据,才能供前端主机读取与使用,而主存储中的数据,往往是那些需要频繁读取的活跃数据。
因此,以占用系统资源的方式频繁地缩减与还原数据,是无意义的,也是资源的浪费。
此外,影响数据缩减率的另一个因素是,它取决于你有多少相同或相似类型的数据:
●数据保存期设置:数据保存的时间越长,重复数据删除引擎发现重复数据的可能性也越大。
●数据类型:一些数据天生比较容易出现重复。如果网络里存在大量的Windows服务器,或者VMware虚拟机,就有希望得到更高的数据缩减率。
●变化速率:数据变化的速率越低,发现重复的机会也就越高。
●数据备份策略:全备份(相对于增量备份和差异备份)的频率越高,数据缩减的潜力也就越大,因为每天的数据有大量的重复。
可以看到,由于归档和备份系统的数据,大部分都是冗余数据,因此天生就可以实现更高的数据缩减率。
最后,是技术问题
比如戴尔PowerProtect DD备份存储拥有高达65:1的数据缩减率,放眼业界同类产品都是顶尖的存在,这就源于其独有的数据缩减专利技术。
而戴尔PowerStore虽然“只有”4:1的数据缩减率,但其数据缩减功能是“始终可用”。意味着PowerStore在数据缩减时不会额外占用控制器的CPU资源,几乎对性能不会产生影响。
这也让企业用户不再陷入性能下降与节省成本的两难,而让数据缩减在主存储真正发挥了用武之地。
戴尔PowerStore采用英特尔®至强®可扩展处理器,该处理器可以优化工作负载,可靠性强,还有高计算力、高稳定性和高效敏捷性,不仅帮助PowerStore轻松满足既定工作负载,也可以为数字化变革做好准备。
最后,总结一下。为什么备份存储与主存储的数据缩减率差别巨大?
答案是两种产品的设计思路不同,存储数据的类型不同,因而不能直接进行数据缩减率的比较。
戴尔服务器R750,R750XS,R750XA主要有什么区别?各主要用途是什么?
也许2022全球超级计算大会上最激动人心的事情之一就是戴尔的新平台。Dell PowerEdge XE9680 终于让该公司能够为其客户提供合法的高端人工智能培训平台。在2022全球超级计算大会的一个发着蓝光的角落里,巨大的系统展示给所有人看。
戴尔正在推进其AMD EPYC服务器计划。它现在提供5个支持 Gen3 EPYC CPU 的 PowerEdge 机架型号,并且正在审查的最新 R7525 提供了令人难以置信的配置支持。
在专门针对VDI优化的2U双路平台中提供加速器卡、存储和计算能力的卓越组合,最大限度地提高应用程序性能。【企业级主流服务器,一机多用】
Dell PowerEdge T440服务器适用于:WEB、文件共享、财务ERP、数据库、虚拟化存储。利用性能、容量和I/O选项满足您的独特需求
戴尔PowerEdge T640是一款用途广泛的高性能服务器,非常适合服务器虚拟化、桌面虚拟化、ERP、CRM、HPC、数据中心等。
PowerEdge M640 是一款针对密度进行了优化的半高刀片式服务器,旨在实现高性能和高效率。它非常适合 XaaS、私有云和 HPC 应用程序。
专为Web托管和多用途应用程序而设计的入门级1U机架式服务器。流畅运行ERP软件,文件共享,财务系统,数据保护等各种应用。
Dell PowerEdge T340塔式服务器,可靠运行、轻松管理并扩展业务。适合关注协作和文件共享且配有远程办公室的成长型企业。
Dell PowerEdge T140,易于使用、安全且实用的入门级服务器,适用于成长型企业。非常适合文件和打印以及销售点应用程序。
Dell EMC PowerEdge R7515 是一款单插槽 2U 服务器,专为处理软件定义的存储、虚拟化和数据分析等工作负载而设计。【按需定制,下单享好礼】
Dell EMC PowerEdge R6525 是一款具备高性能和创新功能的双插槽 1U 服务器,可处理 HPC、VDI 和虚拟化等工作负载。【现货库存、按需定制】
Dell EMC PowerEdge R7525 双插槽 2U 机架式服务器,能够提供强劲的性能和灵活的配置。可处理高性能计算HPC、VDI 和虚拟化等工作负载。
Dell EMC PowerEdge C6525 是一款计算密集型服务器,旨在提高数据中心性能,以应对各种高性能计算 (HPC) 工作负载和应用场景。
Dell Unity XT 380 是 Dell Unity XT 混合闪存阵列系列的入口点。它专为多云部署而构建,提供简单且价格合理的统一存储,旨在提高性能和效率,并在所有数据池中实现在线数据减少,并且能够运行不需要性能和延迟的通用工作负载NVMe 架构,处理内联数据缩减,并提供不影响性能的数据服务。
使用 Dell Unity XT 480 混合闪存阵列处理各种通用工作负载。这个统一的存储平台平衡了闪存的性能和磁盘的经济性,能够同时运行不需要 NVMe 架构的性能和延迟的混合应用程序工作负载,处理内联数据减少,并提供不影响性能的数据服务。
使用 Dell Unity XT 680 混合闪存阵列覆盖广泛的通用工作负载。该统一存储平台专为多云部署而构建,平衡了闪存的性能和磁盘的经济性,能够同时运行不需要 NVMe 架构的性能和延迟的混合应用程序工作负载,处理内联数据减少,并提供对性能没有影响的数据服务。
Dell Unity XT 880 混合闪存阵列平衡了闪存的性能与磁盘的经济性,能够同时运行不需要 NVMe 架构的性能和延迟的通用用途,处理内联数据减少,并提供无性能的数据服务影响。