首页 企业版 VAST Data 深度学习数据平台 – 专为 AI 打造

VAST Data 深度学习数据平台 – 专为 AI 打造

by 哈罗德弗里茨
庞大的数据平台

VAST Data推出了一个数据计算平台,旨在成为人工智能辅助发现的基础。 VAST 数据平台是最新产品,将存储、数据库和虚拟化计算引擎服务统一在一个可扩展的系统中,该系统是为人工智能的未来而构建的。

VAST Data推出了一个数据计算平台,旨在成为人工智能辅助发现的基础。 VAST 数据平台是最新产品,将存储、数据库和虚拟化计算引擎服务统一在一个可扩展的系统中,该系统是为人工智能的未来而构建的。

VAST 数据平台旨在包含实时生成和处理的大量全球数据,包括视频、图像、自由文本、数据流和仪器数据等非结构化和结构化数据。 这种方法旨在缩小事件驱动和数据驱动架构之间的差距,能够访问和处理任何私有或主要公共云数据中心中的数据,将可查询的语义层嵌入到数据中以更好地理解自然数据并计算数据每次交互都实时、连续、递归地进行。庞大的数据平台

超越大型语言模型到人工智能辅助发现

生成式人工智能和大型语言模型(LLM)向世界介绍了人工智能的早期功能; 然而,法学硕士仅限于执行日常任务,例如业务报告或背诵已知信息。 只有当机器能够通过捕获、合成和学习数据来重新创建发现过程时,人工智能的真正承诺才能实现。 现在可以在几天而不是几十年内达到这种专业化水平。

人工智能驱动的发现将加速寻找解决我们最大挑战的方法,寻找疾病和癌症的治疗方法,应对气候变化,创新农业方法,以及发现新的科学和数学领域。 现有的数据平台深受全球企业的欢迎,大大降低了商业智能和报告应用程序的基础设施部署复杂性。 然而,它们仍然需要满足新的深度学习应用的需求。

下一代人工智能基础设施必须提供并行文件访问、用于神经网络训练和非结构化数据推理的 GPU 优化性能,以及跨越混合多云和边缘环境的全局命名空间; 所有这些都统一在一个易于管理的产品中,支持联合深度学习。

DASE:VAST 数据平台的核心

从一开始,VAST 就将自然数据、丰富的元数据、函数和触发器置于 VAST 分解共享一切 (DASE) 分布式系统架构的中心。 通过消除性能、容量、规模、简单性和弹性之间的权衡,DASE 为深度学习奠定了数据基础,使得在整个企业数据上训练模型成为可能。 允许客户向系统添加逻辑,机器可以持续递归地丰富和理解来自自然世界的数据。

VAST 路线图的新公告提出了一种加速培训工作流程的方法。 对于大型企业来说,拥有生成式人工智能的快速实施路径至关重要。 VAST 制定了他们的计划,通过能够在其平台上存储的对象上运行转换器类型的函数来帮助实现这一目标。 以应用于一组训练图像的随机失真为例,VAST 平台的功能将允许根据需要对训练数据进行转换,而不是以消耗更多存储为代价来预处理它们。

VAST 的发展有望加速培训工作流程,为需要高保真度、快速再培训响应和复杂建​​模的企业内的生成式人工智能开辟了新的视野。 受到高度监管的行业将受益匪浅。 分析师可以利用 VAST 的功能在对象上运行转换器函数,生成详细的模型,而手动创建这些模型将非常耗时和空间。 图形元素的实时生成和更改也可以增强创意工作流程,从而实现更加动态和交互式的设计过程。

统一的全球数据存储、数据库和人工智能计算引擎

VAST DataStore 是一种适用于非结构化数据的可扩展存储架构,消除了存储分层。 VAST 旨在捕获和提供来自自然世界的数据,首先设计了其平台的基础。 VAST DataStore 是一个企业网络附加存储平台,旨在满足强大的 AI 计算架构的需求,例如 NVIDIA DGX SuperPOD AI 超级计算机以及大数据和 HPC 平台。

艾字节级数据存储的效率为闪存基础设施带来了归档经济性,使其适合归档应用程序。 当企业客户希望在其专有数据资产上训练模型时,解决闪存存储的成本对于为深度学习奠定基础至关重要。

庞大数据库

VAST 数据库的引入将结构应用于非结构化自然数据。 通过将数据库、数据仓库和数据湖的特性结合在一个简单、分布式和统一的数据库管理系统中,VAST 解决了事务(实时捕获和编目自然数据)和分析之间的权衡(实时分析和关联数据)。 VAST 数据库 VAST 数据库专为任何规模的快速数据捕获和快速查询而设计,打破了从事件流到存档的实时分析障碍。

凭借合成结构化和非结构化数据的基础,VAST 数据平台可以将原始非结构化数据细化和丰富为结构化、可查询的信息,并支持函数和触发器。 VAST DataEngine 是一种全局功能执行引擎,它将数据中心和云区域整合到一个全局计算框架中。 该引擎支持流行的编程语言,例如 SQL 和 Python。 它引入了事件通知系统和具体化且可重复的模型训练,使管理人工智能管道变得更加容易。

VAST数据空间

VAST 数据平台战略的最后一个要素是 VAST 数据空间。 此全局命名空间允许每个位置以高性能存储、检索和处理来自任何位置的数据,同时在每个访问点之间强制执行严格的一致性。 借助 DataSpace,VAST 数据平台可部署在本地数据中心和边缘环境中。 现在,它还将 DataSpace 访问扩展到领先的公共云平台,包括 AWS、Microsoft Azure 和 Google Cloud。

这个全球性的数据定义计算平台采用一种新方法,通过存储、处理和分发来自单个统一系统的数据,将非结构化数据与结构化数据结合起来。

VAST DataStore、DataBase 和 DataSpace 目前已在 VAST 数据平台中普遍可用。 VAST 数据引擎将于 2024 年推出。

访问 Vast 了解更多信息 BuildBeyond.ai.

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅