搜索
当前所在位置: 首页>GPU卡

建议收藏:RTX 5090从卡和整机方面与4090相比,有何升级与变化

发布时间:2026-05-25 14:24:23 作者:超级管理员 点击:5 【 字体:

RTX 5090显卡

一、5090和4090 GPU卡的综合对比

英伟达RTX 5090于2025年1月7日发布。采用最新的Blackwell架构,配备32GB GDDR7显存,显存带宽高达1792 GB/s,并支持第五代Tensor核心和第四代光线追踪核心。和上一代旗舰GeForce卡4090对比如下:

GPU对比
RTX 5090
RTX 4090
核心
GB202
AD102
架构
Blackwell
Ada Lovelace

CUDA核心数

21,760 
16384
Tensor核心
680(第五代)
512(第四代)
FP16-Tensor TFlops
(后面挂*是稀疏

209.5/419T*

165T/330T*

FP8-Tensor TFlops
838/1676*
660/1321T*
FP4-Tensor TFlops
1676/3352*
不支持
显存类型

GDDR7

GDDR6 x
显存容量
32GB
24GB
显存位宽

512Bit

384Bit
显存带宽

1792GB/s

1008GB/s
PCIe接口
PCIe 5.0x16
PCIe 4.0x16
功耗TDP
575W
450W
GPU机型
6U8机型,风扇卡和涡轮卡并存,风扇卡四宽,高度更高
4U8机型,涡轮卡为主
单卡标准双宽全高全长

主流的5090涡轮卡的尺寸情况如下,4U的标准GPU服务器通常支持的GPU卡的高度不超过120mm,因此我们看到的5090GPU机型多为5、6U,其中6U更多。

目前市场上的涡轮卡5090有两个高度,125和135mm,空间越大散热效果越好。

5090的风扇卡不同品牌的尺寸也有差异,宽度都是4宽、高度和长度举例如下:358mm(长)x149mm(高)x76mm(宽);

二、RTX5090 八卡机服务器的特点

和4090的GPU服务器相比,5090整机主要有以下3类不同:

1、平台升级至PCIe5.0:5090的接口是PCIe5.0,为了把GPU的性能发挥到最优,需要CPU也升级至支持PCIe5.0,比如Intel的第四代、第五代的至强可扩展CPU,AMD的Genoa  9004系列处理器,CPU的升级也导致服务器平台价格的提升;

2、整机尺寸提升至6U:前面章节介绍到,5090卡的高度超过了120mm,标准的4U机箱已不再适用,需要提升至5或6U的高度,并且风扇卡的宽度为4宽,单排放不下8卡,风扇卡机型必须采用前后2个GPU背板的设计;

3、供电散热的要求更高:一张5090的GPU的标准TDP是575W(实际工作时,如果超频可超过这个功率),在散热和供电上需要进行重点考虑,比如支持3+1或者2+2模式的2700w或3200w冗余电源方案.

三、RTX5090有关的典型问题

1、5090的价格问题:5090年初的时候价格炒的很高,一度超过3w人民币,但是随着市场的冷静,最近单卡价格(8月的第一周)来到了2万人民币左右,和4090持平了。下图是从某个渠道获得的一个报价,风扇卡跌破2w,但是涡轮卡要贵1-2k:

2、单台8卡5090算力多少:目前给客户做方案,一台8卡5090还是建议按稀疏FP16精度算力来算,单台八卡机的算力等于419T x 8=3.25P,粗略估算的话按照3.2或者3.3P都行;如果是稠密算力则对应数值减半;

3、风扇还是涡轮,怎么选:目前市场上做5090整机的分两个路线就是涡轮还是风扇,风扇卡的直接的优势价格便宜,一张卡从价格上要比涡轮卡低1-2千,但是涡轮卡更符合数据中心场景的应用,因为散热方面更优,在7x24小时运行商可靠性更高,但是需要对风扇卡进行改装,一旦改装就失去了原厂质保,这个取舍需要客户综合考虑,个人角度还是更倾向于涡轮卡的方案(大家有何不同意见可以评论区聊)。

4、老黄发布会上5090的AI TOPS 3352是啥?结合咨询英伟达原厂的朋友和查看官方资料,3352 TOPS指的就是FP4精度的Tensor加速算力的稀疏数值,因为从5090这一代(Blackwell架构)开始就原生支持FP4精度算力,老黄会根据最新支持的精度来做营销(吹牛);反观4090的1321其实是FP8精度的Tensor加速算力的稀疏数值(因为4090不支持FP4);


阅读全文
相关推荐

上新!移动模型服务平台MoMA上架多款千问旗舰模型

上新!移动模型服务平台MoMA上架多款千问旗舰模型
AI“超级入口”再迎重磅升级!移动模型服务平台MoMA集中上架三大品类、多款千问优质旗舰模型,进一步扩充模型储备、拓宽应用场景,让用户便捷对接顶尖AI算力与模型资源,精准匹配各类AI使用需求。丰富模型矩阵,适配多元使用场景本次上新打破单一模型类型局限,以“汇聚更多模型能力”为核心,精准覆盖旗舰模型的高效适配与...

DeepSeek-V4.1 定档 6 月之核心技术深度前瞻!2026

DeepSeek-V4.1 定档 6 月之核心技术深度前瞻!2026
前言:一场提前泄露的 “阳谋”2026 年的五一假期刚过,整个 AI 圈被一则消息炸得无法安宁 ——DeepSeek 不仅完成了震惊业界的 500 亿元天价融资,更官宣 V4.1 版本将于 6 月正式上线。如果说 4 月份发布的 V4 是一个完成国产适配的技术预览版,那么即将到来的 V4.1,则是一场蓄谋已久的行业总攻。这早已不只是普通的模型版...

10大算力芯片全解析:CPU/GPU/TPU/NPU/LPU/FPGA......

10大算力芯片全解析:CPU/GPU/TPU/NPU/LPU/FPGA......
在 AI 大模型、自动驾驶、边缘计算全面爆发的今天,算力已经成为数字时代的 “新石油/新电力”,而承载算力的各类处理器芯片,就是驱动这场技术革命的 “发动机”。很多人都会有这样的困惑:CPU、GPU、TPU、NPU…… 这些长得差不多的缩写到底有什么区别?各自适合干什么?谁才是 AI 时代的 “王者”?10 大芯片核心定...

北京 A100-40G 现货出租

北京 A100-40G 现货出租
GPU裸金属服务器-A100*8CPU: 2*Intel Xeon Gold 6248R(24Core,3.0GHz)内存:24*32GB系统盘:2*480GBSATA SSD数据盘:4*1.92TB NVMe SSD显卡:Nvidia A100 PCIE 40G *8网卡:1 x2*25GE价格:85000/月有效期:7天 压一付一 年闭口...

总投资约50亿!交通银行贵安数据中心正式接入电网

总投资约50亿!交通银行贵安数据中心正式接入电网
2026年5月23日消息,交通银行贵安数据中心于近日已圆满完成全流程通电调试,正式接入电网,目前相关带电设备运行安全稳定。交通银行贵安数据中心项目位于贵安新区马场产业新城,是交通银行总行异地数据中心,也是贵州省重点工程。项目总投资约50亿元,总建筑面积约18万平方米,整体规划部署服务器超20万台,按照“整体规划、...

AutoDL 算力平台|弹性普惠算力,让 AI 开发零门槛

AutoDL 算力平台|弹性普惠算力,让 AI 开发零门槛
在 AI 技术普及的浪潮中,个人开发者、高校科研团队与中小企业,常面临算力成本高、环境配置复杂、资源弹性不足的痛点。AutoDL 作为国内领先的 C 端 AI 算力云平台,以 “弹性、好用、省钱” 为核心定位,深耕轻量化算力服务,凭借万卡级算力储备、开箱即用的开发环境、极致性价比的计费模式,成为 AI 开发者的首选算力伙伴...

建议收藏:RTX 5090从卡和整机方面与4090相比,有何升级与变化

建议收藏:RTX 5090从卡和整机方面与4090相比,有何升级与变化
一、5090和4090 GPU卡的综合对比英伟达RTX 5090于2025年1月7日发布。采用最新的Blackwell架构,配备32GB GDDR7显存,显存带宽高达1792 GB/s,并支持第五代Tensor核心和第四代光线追踪核心。和上一代旗舰GeForce卡4090对比如下:GPU对比RTX 5090RTX 4090核心GB202AD102架构BlackwellAda LovelaceCUDA核心数21,76016384...

万亿空间!NVIDIA 2027财年第一季度财务报告深度解读!

万亿空间!NVIDIA 2027财年第一季度财务报告深度解读!
AI基础设施的投资浪潮,早已跨过概念炒作阶段,进入实打实的业绩兑现周期。美东时间5月20日,英伟达发布2027财年第一季度重磅财报,交出了一份颠覆行业预期的成绩单。即便彻底失去中国主流AI芯片市场,英伟达依旧创下单季营收、净利润双历史新高,用硬核数据印证了自身在全球AI产业链的绝对统治力。更值得关注的是,这份财报...

总投资24亿!中国银联黄山数据中心园区项目正式通电

总投资24亿!中国银联黄山数据中心园区项目正式通电
2026年5月23日消息,银联黄山园区项目10KV开关站A/B双回路于近日成功完成高压送电。据悉,银联黄山园区项目位于安徽省黄山市高新技术产业开发区丹霞路与银蝶湖北路交口东北侧部分地块(烟草公司和中科创新广场用地东侧,百川路南侧),是国家关键金融基础设施重要组成部分,也是安徽省重点项目和黄山市头号工程。该项目总投...

极智算算力平台|硬核算力底座,赋能 AI 全域高效落地

极智算算力平台|硬核算力底座,赋能 AI 全域高效落地
随着人工智能技术飞速普及,大模型训练、模型微调、AI 推理、高性能计算、数字孪生等场景迎来爆发式增长,稳定、合规、高性价比的算力资源,已成为企业、科研机构与开发者发展的核心刚需。极智算算力平台深耕 GPU 算力服务赛道,聚焦合规算力供给、整机租赁、服务器托管、大模型一站式部署,以顶尖硬件配置、灵活服务模式、...
返回顶部