FP4 精度是一种 4 位浮点格式(通常采用 1 位符号

作者:mile官网 日期:2026-01-07 浏览: 来源:mile米乐集团

  其核心目标是让开发者、研究人员和数据科学家无需依赖云端集群◆=,即可在本地桌面上开发•、微调并运行从 1000 亿到 1 万亿参数的开源及前沿 AI 模型,打通了从本地原型设计到云端大规模扩展的通道。

  作为入门级旗舰▼▽,DGX Spark 专为 1000 亿参数级别的模型设计。该系统引入了 NVFP4 数据格式,能将 AI 模型压缩高达 70% 且不损失智能表现■◇。

  此外,英伟达优化与开源社区(如llama▪☆.cpp)的深度合作,该系统在运行 SOTA(最先进)模型时平均性能提升了 35%=■▼,并显著加快了 LLM(大语言模型)的加载速度。

  面向企业级和前沿实验室的 DGX Station 则不仅是性能怪兽▲,更是行业标杆。该机型搭载 GB300 Grace Blackwell Ultra 超级芯片,配备高达 775 GB 的 FP4 精度一致性内存,这一配置让其能够本地运行高达 1 万亿参数的巨型模型。

  IT之家注•▼:一致性内存(Coherent Memory)指在 CPU 和 GPU 之间共享同一地址空间并实现硬件级数据同步的架构,通过 2026 年主流的 NVLink-C2C 或 PCIe Gen6/7 互连技术,数据可以在不同处理器间自由流动,无需显式的内存拷贝过程,显著降低了延迟。

  FP4 精度是一种 4 位浮点格式(通常采用 1 位符号△•、2 位指数、1 位尾数的 E2M1 布局),专为 Blackwell 及后续 Rubin 架构优化□,能在保持模型精度的前提下,将显存占用降低至 FP16 的四分之一,吞吐量提升高达 2-3 倍…-。

  在硬件供应方面▷-,DGX Spark 及合作伙伴推出的 GB10 系统即日起通过戴尔、惠普、联想、华硕等厂商发售,而旗舰级的 DGX Station 将于今年晚些时候正式上市-◆-。返回搜狐,查看更多