搜索
当前所在位置: 首页>算力百科

国内GPU卡全线飙涨原因分析

发布时间:2026-06-03 09:07:02 作者:超级管理员 点击:2 【 字体:

国内GPU卡全线飙涨原因分析

紧张升级

5 月份,非常非常多的人寄希望于两个大佬谈判之后的的 GPU管制放松,特别是上一代 hopper架构的顶配算力卡松绑,弥补内部的算力不足,但是结果事与愿违,双方在 GPU 算力领域抓紧了卡脖子竞赛,彼此相互掐。(不要抱幻想了,干就完了)

咱发布“韬定律”,引领未来半导体产业自主可控发展;对面发布史上最严 BIS 禁令,全面封杀特殊渠道 N卡贸易;多条隐秘供应渠道出现波动,目前处于静默状态,并且东南亚风声正紧,导致靠港设备急剧减少,设备减少,需求没少,最终导致中间商层层加价,现货交易链条长,每层经销商为对冲风险和牟利,都会加价并截留部分库存。只要有人以更高价成交,整个市场的底价立刻被拉高。我们做了一个价格预测!

突发监管,B300转运风险激增,现货喊价800万5090 V2 D被禁 ,Pro6000D涨价,买涨不买跌的GPU囤货之战

GPU金融属性持续增强

GPU 、茅台、房子,目前本质上是一样的东西,除了自身原有属性价值外,更多的是金融价值,当然这个金融价值是有时效性的,但是短期内 GPU金融价值持续增强

GPU金融属性持续增强,导致 A 股运作的企业和基金纷纷参与到 GPU 囤货和倒货的过程中,无形中提高了中间环节的价值;

A 股公司持有优质 GPU 资产,只要发布公告,至少 2 个涨停,也代表了参与未来产业的意愿和ai 劳动力转型的渴望,代表着未来的潜力,因此采购 GPU 成为资本运作重要手段!

算力出租到 tokens 出租转型

中国AI算力需求的爆发式增长是B300价格暴涨的需求端根本驱动力

过去大厂租赁裸算力资源,一堆运营商和aidc运营方出租裸算力,大厂自己部署大模型,用来推理卖 tokens;

运营商 tokens 转型一样,禁止裸算力租赁,直接部署大模型,强行租赁 tokens,这些算力租赁给大厂,用来做基础 tokens 运营;

基于tokens 运营模式,B300对推理性能的数倍提升能直接转化为成本优势。对前沿AI企业来说,高价抢购现货算得过账,这为高价提供了最后的需求支撑

原来我们做了测算预测 690 是上限, 没想到 API tokens 竟然涨价了,只要 tokens 一直涨,b300 涨到 1000 也是有利可图的,这个就尴尬啦!B300 涨价闭环了....

严打东南亚算力

随着双方博弈推进,物理层面的禁运,gpu 设备贸易基本上已经处于脱钩状态,但是云租赁业务在持续,“算力出海”在海外用算力成为一个 bug,让更多资本去到东南亚建设 AIDC;一个落后的东南亚竟然成为全球 AIDC 算力建设高潮区域,想想都知道怎么回事;下一步重点关照东南亚 AIDC 业务,目前给东南亚 AIDC 两条路:

趁着现在没有严打,想尽一切办法把gpu 设备,弄进国内;

趁着现在没有严打,想尽一切办法把 GPU设备,转移到其他“安全区域”

覆巢之下,安有完卵,早做打算!

B300短缺外溢

买不到 B300,大家就开始外溢 5090、pro 6000、 pro 6000d 等外溢 Blackwell 算力需求,5 月底大厂已经放出多个 5090大单,用于弥补算力短缺,先紧急顶上!

这种心态导致全网的 n 卡都在飙涨...

阅读全文
相关推荐

GTX显卡和RTX显卡的区别是什么?

GTX显卡和RTX显卡的区别是什么?
TX 与 RTX 的核心差异在于架构代际、专用硬件单元与新技术支持:RTX 具备硬件级光线追踪与AI 超分(DLSS),GTX 无专用单元,仅能软件模拟光追、不支持 DLSS。核心差异速览关键技术解释RT Core(光线追踪核心):RTX 专属,加速光线求交与反射 / 折射 / 阴影计算,光追效率远高于 GTX 的软件模拟。Tensor Core(张量核心):...

西柚云超算与云南联通正式达成战略合作,将共建云南科研超算中心节点

西柚云超算与云南联通正式达成战略合作,将共建云南科研超算中心节点
2026年5月25日消息,西柚云超算与中国联通云南昆明分公司在昆明正式签署战略合作协议,标志着双方将携手共建云南科研超算中心节点,共同推动云南省算力基础设施建设与数字经济发展。根据战略合作协议,双方将围绕联通环湖东湖机房开展深度合作,依托该机房优质的网络资源和电力保障条件,共同建设集高性能计算、大规模存储互...

总投资约50亿!交通银行贵安数据中心正式接入电网

总投资约50亿!交通银行贵安数据中心正式接入电网
2026年5月23日消息,交通银行贵安数据中心于近日已圆满完成全流程通电调试,正式接入电网,目前相关带电设备运行安全稳定。交通银行贵安数据中心项目位于贵安新区马场产业新城,是交通银行总行异地数据中心,也是贵州省重点工程。项目总投资约50亿元,总建筑面积约18万平方米,整体规划部署服务器超20万台,按照“整体规划、...

总投资24亿!中国银联黄山数据中心园区项目正式通电

总投资24亿!中国银联黄山数据中心园区项目正式通电
2026年5月23日消息,银联黄山园区项目10KV开关站A/B双回路于近日成功完成高压送电。据悉,银联黄山园区项目位于安徽省黄山市高新技术产业开发区丹霞路与银蝶湖北路交口东北侧部分地块(烟草公司和中科创新广场用地东侧,百川路南侧),是国家关键金融基础设施重要组成部分,也是安徽省重点项目和黄山市头号工程。该项目总投...

呼和浩特 H100*8卡 45台 现货出租

呼和浩特 H100*8卡 45台 现货出租
GPU裸金属服务器-A100*8CPU: 2*Intel Xeon Gold 6248R(24Core,3.0GHz)内存:24*32GB系统盘:2*480GBSATA SSD数据盘:4*1.92TB NVMe SSD显卡:Nvidia A100 PCIE 40G *8网卡:1 x2*25GE...

三步部署DeepSeek V4模型

三步部署DeepSeek V4模型
背景:DeepSeek V4其核心突破在于全系标配 100 万 token(约 75 万汉字)的超长上下文窗口‌,并针对效率与性能进行了系统性优化。目前发布了两个版本,分别为DeepSeekV4-Pro(旗舰版)‌ 和 ‌‌DeepSeek V4-Flash(轻量版),下面以DeepSeek V4-Flash(轻量版284B)部署为例展开。参考链接:https://docs.vllm.ai/projects/a...

上新!移动模型服务平台MoMA上架多款千问旗舰模型

上新!移动模型服务平台MoMA上架多款千问旗舰模型
AI“超级入口”再迎重磅升级!移动模型服务平台MoMA集中上架三大品类、多款千问优质旗舰模型,进一步扩充模型储备、拓宽应用场景,让用户便捷对接顶尖AI算力与模型资源,精准匹配各类AI使用需求。丰富模型矩阵,适配多元使用场景本次上新打破单一模型类型局限,以“汇聚更多模型能力”为核心,精准覆盖旗舰模型的高效适配与...

豆包即将将“正式收费”!

豆包即将将“正式收费”!
据报,知情人士透露,豆包预计将在6月下旬正式上线付费内容,并于同期举行的Force大会上更新相关功能。之所以选择这一时间节点,是因为PC端与移动端仍需约一个月时间,完成基础功能与收费体系的适配改造。若进展顺利,豆包将于三季度进一步结合电商功能更新完善付费场景,并通过补贴为抖音商城进行引流,四季度进入运行期。...

2026年大模型全景:国内外总览

2026年大模型全景:国内外总览
背景:2026 年全球大模型格局呈现国内以开源为主导、国外以闭源为核心的分化态势,头部厂商普遍采用开源 + 闭源双轨策略;(1)技术层面:多模态原生融合、超长上下文、强编程能力、原生智能体能力、低推理成本(包括国产芯片适配)已成为旗舰模型五大标配特征;(2)商业模式层面:编程能力订阅套餐已与 API 按量付费、企业...

西方锁死“空间”,华为征服“时间”:τ定律背后的算力大置换

西方锁死“空间”,华为征服“时间”:τ定律背后的算力大置换
5月25日,全网舆论场被娱乐热搜、日常琐事填满,大众沉浸在碎片化的热闹里,几乎无人留意,科技界悄然发生了一件改写人类半导体60年规则的里程碑事件。华为正式发布国产算力首个全球标准——韬(τ)定律。这不是一次普通的技术发布会,不是又一款芯片的迭代升级,更不是一场行业噱头式的概念炒作。这是一份赤裸裸的摩尔定律...
返回顶部