存储评论网

QNAP推出面向私有LLM和生成式AI工作负载的QAI-h1290FX边缘AI存储服务器

企业版  ◇  中型 NAS

QNAP Systems 推出了 QAI-h1290FX,这是一款边缘 AI 存储服务器,专为希望在自有基础设施上运行大型语言模型、检索增强型生成搜索和其他生成式 AI 工作负载的企业而设计。该系统旨在帮助企业在采用 AI 技术的同时,兼顾数据隐私、低延迟、治理和运维控制等需求,使团队能够在本地部署 AI 应用,而无需将敏感数据发送到公共云平台。

QNAP QAI h1290FX 前面板

企业可以利用 QAI-h1290FX 部署内部 AI 助手,用于员工培训、政策咨询和知识查询,并将底层数据保留在企业内部。法务、财务、人力资源和运营团队可以构建私有的 RAG 管道,用于搜索合同、报告和内部记录,提供比传统关键词搜索更丰富的上下文信息。创意团队可以运行 Stable Diffusion 或 ComfyUI 等图像生成工具,用于设计和内容工作流程。而 IT 团队则可以使用 n8n 等自动化工具来触发推理任务、生成内容或在业务系统中路由警报。

QNAP QAI-h1290FX 组件、扩展和 I/O

QAI-h1290FX 采用 AMD EPYC 7302P 处理器和 12 个 U.2 NVMe/SATA SSD 插槽,将服务器级计算能力与专为需要快速数据访问的 AI 工作负载量身定制的全闪存存储设计相结合。这款 16 核 32 线程处理器支持推理、虚拟化和并行工作负载。同时,SSD 架构专为频繁的模型执行、高速数据流传输以及对数据集、嵌入、文档和生成内容的快速访问而设计。

该系统还支持可选的 NVIDIA RTX PRO 6000 Blackwell Max-Q 工作站 GPU 加速,可提供高达 96GB 的 GPU 显存,以满足更苛刻的本地 AI 工作负载需求。对 CUDA、TensorRT 和 Transformer Engine 加速的支持,使团队无需从头开始构建独立的 GPU 工作站,即可在本地运行大型语言模型推理、图像生成和深度学习应用程序。

QNAP QAI h1290FX 后面板

QAI-h1290FX 提供内置高速网络,配备两个 25GbE SFP28 SmartNIC 端口和两个 2.5GbE 端口,并通过 2.5GbE 端口支持网络唤醒 (Wake-on-LAN) 功能。扩展方面,它包含四个 PCIe 插槽,其中三个为 PCIe Gen 4 x16 插槽,一个为 PCIe Gen 4 x8 插槽,可用于添加更高速的网络、GPU 或其他兼容的扩展卡。其他 I/O 接口包括三个 USB 3.2 Gen 1 端口、巨型帧支持、SR-IOV、GPU 直通,并且其十二个硬盘位兼容 2.5 英寸 SATA SSD 和 U.2 NVMe PCIe Gen4 x4 SSD。

威联通 QAI-h1290FX 规格

规格 QNAP QAI-h1290FX
概述
型号 AI-h1290FX-7302P-128G
处理器和内存
中央处理器 AMD EPYC™ 7302P 16核/32线程处理器,最高主频达3.3 GHz
CPU架构 64位x86
加密引擎  (AES-NI)
系统内存 128 GB RDIMM DDR4 ECC
最大内存 1TB (8x128GB)
内存插槽 8 个 RDIMM DDR4
闪存 8GB(双启动操作系统保护)
存放
驱动湾 12 x 2.5 英寸 U.2 PCIe NVMe / SATA 6Gbps
该系统出厂时未配备固态硬盘。
如需查看 SSD 兼容性列表,请访问 https://www.qnap.com/compatibility/
驱动器兼容性 2.5 英寸托架:
2.5英寸SATA固态硬盘
2.5 英寸 U.2 NVMe PCIe Gen4 x4 固态硬盘
支持热插拔
SSD 缓存加速支持
GPU和虚拟化
GPU直通
车联网
社交
2.5 千兆以太网端口 (2.5G/1G/100M) 2 (2.5G/1G/100M/10M)
25个千兆以太网端口 2 个 25GbE SFP28 智能网卡端口
局域网唤醒 (WOL) 只有 2.5GbE 端口
巨型框架
扩展和端口
PCIe 插槽 4
插槽 1:PCIe Gen 4 x16
插槽 2:PCIe Gen 4 x16
插槽 3:PCIe Gen 4 x8
插槽 4:PCIe Gen 4 x16
PCIe 插槽 1 和插槽 2 的卡尺寸:185 x 111.15 x 18.76 毫米 / 7.28 x 4.38 x 0.74 英寸。
PCIe 插槽 3 和插槽 4 的卡尺寸:280 x 111.15 x 18.76 毫米 / 11.02 x 4.38 x 0.74 英寸。
如果不使用下一个 PCIe 插槽,可以安装更宽的卡。
USB 3.2 Gen 1连接埠 3
物理设计
外形
LED指示灯 电源/状态、LAN、USB、SSD1-12
液晶显示/按钮
钮扣 电源、重置、USB 自动复制
外形尺寸(高x宽x) 150×368×362毫米
尺寸不包含脚垫(脚垫高度可能高达 10 毫米/0.39 英寸,具体取决于型号)。
重量(净重) 10.4 kg
重量(毛重) 11.3 kg
环境与电力
工作温度 0 – 40°C (32°F – 104°F)
储藏温度 -20 – 70°C(-4°F – 158°F)
相对湿度 5-95% RH 非冷凝,湿球温度:27˚C (80.6˚F)
电源单元 750W,100-240V
风扇 2 x 92 毫米,12VDC
系统警告 蜂鸣器
Kensington安全插槽
保修和连接
标准保修 5
最大限度。 并发连接数 (CIFS) – 最大。 记忆 10000

基于快速存储、GPU加速和本地控制构建

QAI-h1290FX 搭载 QNAP 基于 ZFS 的 QuTS hero 操作系统,具备企业级存储功能,例如数据完整性保护、强大的快照支持和在线重复数据删除。这些功能对于人工智能部署至关重要,因为企业通常需要处理大量重复或相关的文档、嵌入、模型文件、训练材料和生成输出数据。

开发人员和 IT 团队可以通过 QNAP Container Station 在容器化环境中运行 AI 工具,并可直接访问 GPU。同时,Virtualization Station 支持虚拟机的 GPU 直通。这使得企业能够更好地控制计算资源的分配方式,无论是将工作负载部署在容器中以提高速度和可移植性,还是部署在虚拟机中以实现隔离、测试和管理控制。

QAI-h1290FX 还预装了 AnythingLLM、OpenWebUI 和 Ollama 等 AI 工具,使团队能够更快地设置私有 LLM 工作流程和本地聊天界面。此外,我们还在集成其他应用程序(包括 Stable Diffusion、ComfyUI、n8n 和 vLLM),以支持在同一本地平台上进行文本生成、图像创建、工作流程自动化和推理等应用场景。

面向企业人工智能团队的本地基础设施选项

QNAP 表示,该平台可以减少构建本地 AI 基础设施通常所需的人工操作,例如组装 GPU 工作站、安装 AI 工具和配置独立环境。用户可以直接在系统上部署受支持的 AI 模型和应用程序,同时保持对数据的控制权,避免依赖云服务。

它还兼容 QNAP JBOD 扩展柜,为企业提供了一种随着 AI 数据集、内部知识库、模型文件和生成内容的不断增长而扩展存储容量的途径。

QNAP QAI-h1290FX 产品页面

参与 StorageReview

资讯订阅 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter(现为X) | TikTok | RSS订阅

莱尔·史密斯

Lyle 是 StorageReview 的撰稿人,文章涵盖了广泛的终端用户和企业 IT 主题。