QNAP Systems 推出了 QAI-h1290FX,这是一款边缘 AI 存储服务器,专为希望在自有基础设施上运行大型语言模型、检索增强型生成搜索和其他生成式 AI 工作负载的企业而设计。该系统旨在帮助企业在采用 AI 技术的同时,兼顾数据隐私、低延迟、治理和运维控制等需求,使团队能够在本地部署 AI 应用,而无需将敏感数据发送到公共云平台。
企业可以利用 QAI-h1290FX 部署内部 AI 助手,用于员工培训、政策咨询和知识查询,并将底层数据保留在企业内部。法务、财务、人力资源和运营团队可以构建私有的 RAG 管道,用于搜索合同、报告和内部记录,提供比传统关键词搜索更丰富的上下文信息。创意团队可以运行 Stable Diffusion 或 ComfyUI 等图像生成工具,用于设计和内容工作流程。而 IT 团队则可以使用 n8n 等自动化工具来触发推理任务、生成内容或在业务系统中路由警报。
QNAP QAI-h1290FX 组件、扩展和 I/O
QAI-h1290FX 采用 AMD EPYC 7302P 处理器和 12 个 U.2 NVMe/SATA SSD 插槽,将服务器级计算能力与专为需要快速数据访问的 AI 工作负载量身定制的全闪存存储设计相结合。这款 16 核 32 线程处理器支持推理、虚拟化和并行工作负载。同时,SSD 架构专为频繁的模型执行、高速数据流传输以及对数据集、嵌入、文档和生成内容的快速访问而设计。
该系统还支持可选的 NVIDIA RTX PRO 6000 Blackwell Max-Q 工作站 GPU 加速,可提供高达 96GB 的 GPU 显存,以满足更苛刻的本地 AI 工作负载需求。对 CUDA、TensorRT 和 Transformer Engine 加速的支持,使团队无需从头开始构建独立的 GPU 工作站,即可在本地运行大型语言模型推理、图像生成和深度学习应用程序。
QAI-h1290FX 提供内置高速网络,配备两个 25GbE SFP28 SmartNIC 端口和两个 2.5GbE 端口,并通过 2.5GbE 端口支持网络唤醒 (Wake-on-LAN) 功能。扩展方面,它包含四个 PCIe 插槽,其中三个为 PCIe Gen 4 x16 插槽,一个为 PCIe Gen 4 x8 插槽,可用于添加更高速的网络、GPU 或其他兼容的扩展卡。其他 I/O 接口包括三个 USB 3.2 Gen 1 端口、巨型帧支持、SR-IOV、GPU 直通,并且其十二个硬盘位兼容 2.5 英寸 SATA SSD 和 U.2 NVMe PCIe Gen4 x4 SSD。
威联通 QAI-h1290FX 规格
| 规格 | QNAP QAI-h1290FX |
|---|---|
| 概述 | |
| 型号 | AI-h1290FX-7302P-128G |
| 处理器和内存 | |
| 中央处理器 | AMD EPYC™ 7302P 16核/32线程处理器,最高主频达3.3 GHz |
| CPU架构 | 64位x86 |
| 加密引擎 | (AES-NI) |
| 系统内存 | 128 GB RDIMM DDR4 ECC |
| 最大内存 | 1TB (8x128GB) |
| 内存插槽 | 8 个 RDIMM DDR4 |
| 闪存 | 8GB(双启动操作系统保护) |
| 存放 | |
| 驱动湾 | 12 x 2.5 英寸 U.2 PCIe NVMe / SATA 6Gbps 该系统出厂时未配备固态硬盘。 如需查看 SSD 兼容性列表,请访问 https://www.qnap.com/compatibility/ |
| 驱动器兼容性 | 2.5 英寸托架: 2.5英寸SATA固态硬盘 2.5 英寸 U.2 NVMe PCIe Gen4 x4 固态硬盘 |
| 支持热插拔 | 是 |
| SSD 缓存加速支持 | 是 |
| GPU和虚拟化 | |
| GPU直通 | 是 |
| 车联网 | 是 |
| 社交 | |
| 2.5 千兆以太网端口 (2.5G/1G/100M) | 2 (2.5G/1G/100M/10M) |
| 25个千兆以太网端口 | 2 个 25GbE SFP28 智能网卡端口 |
| 局域网唤醒 (WOL) | 只有 2.5GbE 端口 |
| 巨型框架 | 是 |
| 扩展和端口 | |
| PCIe 插槽 | 4 插槽 1:PCIe Gen 4 x16 插槽 2:PCIe Gen 4 x16 插槽 3:PCIe Gen 4 x8 插槽 4:PCIe Gen 4 x16 PCIe 插槽 1 和插槽 2 的卡尺寸:185 x 111.15 x 18.76 毫米 / 7.28 x 4.38 x 0.74 英寸。 PCIe 插槽 3 和插槽 4 的卡尺寸:280 x 111.15 x 18.76 毫米 / 11.02 x 4.38 x 0.74 英寸。 如果不使用下一个 PCIe 插槽,可以安装更宽的卡。 |
| USB 3.2 Gen 1连接埠 | 3 |
| 物理设计 | |
| 外形 | 塔 |
| LED指示灯 | 电源/状态、LAN、USB、SSD1-12 |
| 液晶显示/按钮 | 是 |
| 钮扣 | 电源、重置、USB 自动复制 |
| 外形尺寸(高x宽x) | 150×368×362毫米 尺寸不包含脚垫(脚垫高度可能高达 10 毫米/0.39 英寸,具体取决于型号)。 |
| 重量(净重) | 10.4 kg |
| 重量(毛重) | 11.3 kg |
| 环境与电力 | |
| 工作温度 | 0 – 40°C (32°F – 104°F) |
| 储藏温度 | -20 – 70°C(-4°F – 158°F) |
| 相对湿度 | 5-95% RH 非冷凝,湿球温度:27˚C (80.6˚F) |
| 电源单元 | 750W,100-240V |
| 风扇 | 2 x 92 毫米,12VDC |
| 系统警告 | 蜂鸣器 |
| Kensington安全插槽 | 是 |
| 保修和连接 | |
| 标准保修 | 5 |
| 最大限度。 并发连接数 (CIFS) – 最大。 记忆 | 10000 |
基于快速存储、GPU加速和本地控制构建
QAI-h1290FX 搭载 QNAP 基于 ZFS 的 QuTS hero 操作系统,具备企业级存储功能,例如数据完整性保护、强大的快照支持和在线重复数据删除。这些功能对于人工智能部署至关重要,因为企业通常需要处理大量重复或相关的文档、嵌入、模型文件、训练材料和生成输出数据。
开发人员和 IT 团队可以通过 QNAP Container Station 在容器化环境中运行 AI 工具,并可直接访问 GPU。同时,Virtualization Station 支持虚拟机的 GPU 直通。这使得企业能够更好地控制计算资源的分配方式,无论是将工作负载部署在容器中以提高速度和可移植性,还是部署在虚拟机中以实现隔离、测试和管理控制。
QAI-h1290FX 还预装了 AnythingLLM、OpenWebUI 和 Ollama 等 AI 工具,使团队能够更快地设置私有 LLM 工作流程和本地聊天界面。此外,我们还在集成其他应用程序(包括 Stable Diffusion、ComfyUI、n8n 和 vLLM),以支持在同一本地平台上进行文本生成、图像创建、工作流程自动化和推理等应用场景。
面向企业人工智能团队的本地基础设施选项
QNAP 表示,该平台可以减少构建本地 AI 基础设施通常所需的人工操作,例如组装 GPU 工作站、安装 AI 工具和配置独立环境。用户可以直接在系统上部署受支持的 AI 模型和应用程序,同时保持对数据的控制权,避免依赖云服务。
它还兼容 QNAP JBOD 扩展柜,为企业提供了一种随着 AI 数据集、内部知识库、模型文件和生成内容的不断增长而扩展存储容量的途径。




Amazon