首页 > 新闻中心 > 精选阅读

NVIDIA官宣新GPU Rubin CPX!多达128GB显存、推理性能高达百万token 返回列表

花韻仙語2025-09-10 00:00:00编辑发布,已经有个小可爱看过这篇文章啦

9月10日消息,传闻中的128gb显存rtx 5090并不存在。不过,nvidia确实推出了一款配备128gb显存的ai专用gpu。

据悉,NVIDIA下一代GPU架构代号为“Rubin”,预计将于明年正式亮相。

但就在今日,NVIDIA官方发布了“Rubin CPX”——这是一款专为长窗口AI推理和智能体工作负载设计的上下文处理GPU。

该产品基于全新的Rubin架构打造,采用单芯片方案。虽然CUDA核心数量尚未公布,但它配备了四个NVENC编码器和四个NVDEC解码器,以优化视频处理流程,并搭载了高达128GB的GDDR7显存。

根据NVIDIA公布的数据,Rubin CPX在NVFP4精度下峰值算力可达30 PFlops(每秒3亿亿次运算),能够支持百万级token的推理任务。

此外,在处理长上下文场景时,其注意力机制性能相较GB300 NVL72最多提升3倍。

需要指出的是,Rubin CPX目前仅为官方发布阶段,实际产品要到2026年底才会正式上市——没错,正是明年年底。

此前,NVIDIA已透露下一代Rubin GPU与Vera CPU已在台积电成功完成流片,进展符合预期。

  • nvidia
  • ai
  • 将于
  • 架构
  • 年底
  • 的是
  • 这是
  • 最多
  • 仅为
  • 显存

热门新闻

来电咨询