Quantum 对其 ActiveScale 对象存储平台进行了更新,显著提升了对 Glacier 级归档层中冷数据的访问能力。此次更新为基于磁带的冷存储提供了独有的远程恢复功能,该功能采用了 Quantum 专利的纠删码磁带对象存储设计。
除了针对小对象性能优化的全新恢复引擎之外,这些变化还将磁带归档从缓慢的离线存储转变为响应迅速、可通过 API 访问的数据湖,为人工智能、分析和高性能计算做好准备。
ActiveScale 现在允许客户仅从大型对象中检索所需的字节范围,而无需恢复整个文件。这种选择性恢复改变了冷存储的经济性和用户体验。从事 AI 训练、数据验证或合规性查询的团队可以访问完成任务所需的精确数据段,而无需像完整对象检索那样耗费时间和资源。等待时间和出口流量影响的减少加快了工作流程,并提高了计算集群和网络的基础设施效率。Quantum 指出,这是 ActiveScale 特有的 S3 Glacier 自定义扩展,专为基于磁带的冷存储而设计,解决了长期存在的归档可用性问题。
范围恢复 (Ranged Restore) 是一种全新的恢复引擎,它通过智能批处理和请求排序,将小对象操作的吞吐量提升了五倍以上。许多 AI 和分析任务需要大量访问小文件,例如标签分片、特征索引或合规性元数据扫描。传统上,冷层会导致这些任务的延迟。ActiveScale 的性能改进使得小对象恢复速度更快,从而实现了更快的迭代周期、更高的作业并发性以及更有效地利用 GPU 和 CPU 资源。最终效果是,冷层更像是一个用于定向检索的温热分析层。
Quantum 的管理层将此次更新视为提升从归档数据中提取价值的一种方式。Quantum 首席执行官 Hugues Meyrath 强调,关键问题不在于归档数据是否会增长,而在于企业如何快速获取用于训练和分析的正确数据。他指出,等待数小时甚至数天才能获取数据会损害生产力并增加成本。全新的 ActiveScale 功能使大型长期归档数据(以 EB 级为单位)更易于访问,并可立即用于人工智能分析。
首席产品官 Geoff Barrall 补充道,冷数据不应再被视为离线数据。ActiveScale 通过消除传统 Glacier 级存储的限制,将磁带存储转变为一种快速、符合标准的资产,可以进行编程查询并集成到高吞吐量数据工作流中。
这种差异化主要体现在以下三个方面:
- 在字节范围级别进行选择性检索可以减少大型对象的首字节获取时间,并最大限度地减少不必要的数据移动,从而降低出口、计算和能源成本。
- 小对象性能的提升解决了 AI 和 HPC 流水线中的一个重大痛点,即访问数百万个小文件一直以来都与归档层存储的延迟相冲突。
- 该设计在保持 S3 兼容性的同时,以 Quantum 独特的磁带对象方法扩展了 Glacier 语义,使客户能够在不重新设计应用程序的情况下实现冷层访问的现代化。
ActiveScale 的纠删码磁带对象设计的核心至关重要。纠删码可在介质间保护数据持久性,同时允许在恢复操作期间进行并行处理。ActiveScale 通过智能管理读取操作和请求排序来优化磁带运动,从而降低机械开销,并将顺序介质转化为可用于选择性、高吞吐量检索的可用层。最终形成一个冷存储层,该层可以参与实时或近实时管道,支持训练作业、填充特征存储,并满足特定的电子取证和合规性要求,而无需承担与磁带相关的传统运营成本。
这些更新旨在提升数据工程和 MLOps 的效率。更快、更有针对性的恢复操作使团队能够验证数据集、使用更新后的样本重新运行训练,或执行审计,同时最大限度地减少对正在进行的工作的干扰。以前需要在温层暂存数据的工作流程,现在在许多情况下可以绕过中间步骤,从而简化流程并减少基础设施的冗余。对于管理 PB 级到 EB 级归档数据的组织而言,这种整合可以降低总体拥有成本,同时将长期数据保留成本控制在可控范围内。
从治理和风险角度来看,使归档数据“可查询”能够满足日益增长的数据可用性、沿袭性和可复现性需求。通过选择性访问和提高吞吐量,企业可以将数据存储在经济高效的冷存储层中,同时仍能满足内部截止日期、监管要求和人工智能测试计划所需的响应速度。这种方法还可以通过限制访问的数据量来降低检索风险,从而减少出口风险并简化访问控制。
Quantum 认为这些功能将进一步巩固 ActiveScale 作为一款功能全面、面向未来的冷数据平台的地位。ActiveScale 通过将归档层存储转换为快速、可选择性访问的层,使企业能够释放其数据的价值,无论数据的新旧程度或数据量大小。该平台兼容 Glacier 的 API 以及独特的磁带感知扩展,提供了一种将冷存储集成到 AI 和分析中的实用方法,而无需切换到其他平台。
这些改进功能现已推出。




Amazon