① 高端算力芯片国内现货极缺,存储影响下中低端算力卡价格飙涨; ② 供应链需求带动DDR5内存价格上涨超300%,市场出现“套牌”存储假货与投机炒作现象; ③ 摩尔线程、沐曦等国产芯片企业扎堆上市,但面临高研发与亏损压力,行业正试图通过“开放架构”解决软硬件适配割裂难题。
财联社1月21日讯(记者 付静 王碧微)“我们手上的H100、H200全部都租出去了。前几天准备买64台H200,到处找现货,只零零散散找到了几十台。B200在国内基本上没有现货,上次拿着现金在深圳到处收货,最后只收到十几台。”2026年1月,算力租赁从业者王伟(化名)向财联社记者讲述了他在深圳的抢货经历。
岁末年初,国内的算力供应链下游市场就屡屡传出货源告急的消息,王伟甚至将这种现状称为“地狱模式”。
多位从业者向财联社记者证实,目前市场处于极度供需失衡状态,英伟达B200等高端GPU芯片在国内市场几乎“隐形”,5090、4090等中低端GPU受原材料涨价等因素影响价格激增;下游带动下,DDR5内存条价格大幅跳涨,部分大容量型号涨幅超过300%。
财联社记者注意到,算力市场剧烈波动之时,正值摩尔线程-U(688795.SH)、沐曦股份-U(688802.SH)等国产AI芯片企业密集挂牌上市之际,2026年伊始,算力市场就一个字:热!
显卡商转行炒内存,“套牌车”混入服务器
本月初,有自媒体文章称“元旦上班第一天,算力供应链骂声一片,2026年的算力市场开局就是‘地狱’模式。”
受访的几位算力从业者坦言,这种描述实际上并不夸张。
“很痛苦,现在是算力需求旺盛,但是(算卡)资源确实是不足的。我们现在每天都心惊肉跳,因为买不到货,现在大家手上都没东西租了,都只有一点点零零散散的东西。”王伟告诉财联社记者。
“对我们来说,现在的问题不是买不到卡,而是太贵。”一家AI厂商基础设施负责人告诉财联社记者。
国产算力商基流科技的一位高管告诉财联社记者,目前,高端训练卡由于其不可替代性和供需缺口,价格坚挺,货源稀缺;而消费级显卡,则在显存等核心元器件成本上升传导后价格飙涨。
北京澜启智算业务负责人郑万利告诉财联社记者,2025年9月以来,DDR5内存条价格上涨超300%,DDR4内存条涨幅也超150%。
“64GB DDR5 5600速率的内存现在涨到了1万多,4800速率的也要差不多1万,但在2025年7、8月份时才2000多块钱,涨了4倍多。”郑万利向记者列举了一组数据,“96GB的价格现在应该是2万出头,128GB的往3万去了。”
郑万利算了一笔账:原来一台H100机头价格约30万元,现在仅装配32根64GB内存条的成本就超过30万元。
如果配置B200机头,至少需要24根内存条,加上CPU、硬盘、机架、电源等,整机价格已攀升至六七十万元。
郑万利还透露,H200整机价格最低时曾降至190多万元,目前最新报价已回升至230多万元。
上述AI厂商基础设施负责人则透露,“目前8卡5090加CPU加内存的整机已经报价40多万,上个月只要32万。”
根据慢慢买App,一款10月在京东售价为16899元的七彩虹RTX5090D显卡价格已经飙涨至今日的20399元。
甚至连二手租赁价格也随之波动,一位算力租赁商告诉记者,现在算力租赁价格相较此前低点已经涨了5%-10%。
除了供应链本身的产能受限,投机资金的涌入加剧了市场的疯狂,渠道供应商马明(化名)观察到,一些原先做显卡的渠道商现在转行做起了存储生意。
“显卡资金占用量大,而存储风险更低,涨幅更快,能快进快出。”马明告诉财联社记者,这些渠道商基本上从去年10月、11月开始收货,手法是“左脚踩右脚”——低价收货,高价出掉,再用更高的价格收回,不断推高市场水位。
马明举例分析,市场上存在三类存储产品:真实消耗的、未消耗的、库存补出来的。
有人以4000元收购2000根内存,其中1000根被装机消耗,另外1000根则以4300元卖给下一手投机者。
在高额利润的诱惑下,黑灰产链条开始滋生,马明向记者揭露了存储市场背后的“假内存”现象。
第一类是“套牌车”,卖方手中有正版货源,也有拆机货,他们将拆机货原本的标签换掉,包装成正版货出售,同一个序列号可能同时出现在两根内存上,卖给不同的客户。
第二类情况更为恶劣,马明透露,市场上出现了连PCB板、颗粒都是假的内存条,这些产品并非原厂生产,无法达到原厂质检标准,装入服务器后会出现严重的性能问题。
“其实除了内存,硬盘、处理器都涨得很疯狂。”马明补充道,硬盘价格翻了1-3倍,服务器处理器涨幅很大,且很多型号处于缺货状态。
一位渠道商告诉财联社记者,一款英特尔i5处理器,现在售价约1800元,9月份大概1400元,一路涨起来;英特尔至强6530处理器目前售价约9200元,而一个月前则为8000出头。
KeyBanc数据显示,由于超大规模云服务商“扫货”,英特尔与AMD在2026全年的服务器CPU产能已基本售罄。为了应对供需极端失衡并确保后续供应稳定,两家公司均计划将服务器CPU价格上调10%-15%。
H200“看得到摸不着”,国内算力需求将分流
在价格暴涨的同时,核心算力芯片的供应依然是产业链的痛点。
尽管近期美国已放宽英伟达H200对华出口,但多位受访者表示,国内供应实质性短缺的局面并未改变。
“目前的情况比较特殊。”一位算力服务企业高管告诉财联社记者,虽然政策有放宽迹象,但实际进口审批流程依然严谨,导致H200的实质性供给非常有限,国内处于“看得到但还不太摸得着”的状态。
优刻得(688158.SH)服务器中心及AI算力负责人丁振雷持有类似观点,他向财联社记者表示,美国放宽H200出口,长期战略上不会产生影响,但在短期内,面对大的算力场景,企业可能会“缓一缓”,等待具体落地情况。
这种“看得到摸不着”的供应现状,正在倒逼算力需求在市场中分流。
前述基流科技高管分析,未来市场会形成“多层次、多路径”的并行格局。
对极致性能和有国际生态依赖的场景,企业仍会争取英伟达芯片;但对更广泛的行业应用、对数据安全与自主可控有高要求的政务和企业市场,国产算力已成为主流选择。
“国产算力芯片的机会,不在于在通用赛道上全面正面超越,而在于聚焦优势战场。”该高管认为,在推理场景、工业质检、智能政务、金融风控等行业专用场景,国产芯片在能效比、成本和特定模型适配上已展现出性价比优势。
云服务厂商的采购动作印证了这一趋势,丁振雷向财联社记者透露,优刻得目前已采购了3-5家国产芯片。
“只要能国产替代的,我们首先能做的工作就是提早适配。当它的性能优化到一定程度的时候就快速引入,这时候供给来源要多样化。”丁振雷表示。
与此同时,软件定义的趋势正在反向重塑硬件标准。
郑万利向财联社记者分析,DeepSeek等国产大模型的爆发,对MoE(混合专家)架构和混合精度训练提出了具体要求,这倒逼国产硬件厂商必须跨过“适配”这道门槛。
郑万利判断,国产算力接下来会迎来更多市场需求,未来两年将是国产算力开拓商业市场的关键期,“国产卡肯定是个方向”。
对于市场上关于“算力过剩”或“泡沫”的讨论,一线从业者给出了不同的观察。
“那些说算力过剩的,都是制造焦虑。国内算力是远远不够的。”王伟直言,目前模型距离成为真正的生产工具还有距离,需要持续投资。
丁振雷则从技术逻辑层面反驳了泡沫论,他认为,2025年是Agent(智能体)元年,Agent是提高生产力的逻辑而非单纯的降本逻辑。一个真正好用的Agent落地,对Token(词元)的消耗是巨大的。
“如果Agent不落地,算力可能是过剩的;但只要解决了真正的生产力问题,算力还是欠缺的。”丁振雷表示。
上市潮背后,“烟囱”难题仍存
供应链焦虑的另一面,是国产芯片企业在资本市场的高歌猛进。
2025年底,摩尔线程、沐曦股份相继在科创板上市,首日涨幅分别达到468.78%和692.95%。随后,壁仞科技(06082.HK)登陆港交所,天数智芯(09903.HK)启动港股公开认购并获得超300倍的超额认购。
资本热潮下,相关公司的财务数据尚待改善。根据招股书数据,摩尔线程与沐曦股份过去三年合计亏损超过80亿元;正在冲刺科创板的长鑫科技(DRAM厂商),截至2025年6月30日,累计研发投入188.67亿元,占累计营业收入的33.11%,但其2025年前三季度的归母净利润-52.8亿元,同比仅略微减亏。
同时,TrendForce集邦咨询分析师龚明德告诉财联社记者,预计2026年全球AI服务器产值将提升逾42%,达到4300亿美元,在这个庞大的市场中,国产厂商面临的不仅是资金问题,更是如何解决“不好用”的技术难题。
海光信息(688041.SH)副总裁吴宗友在接受财联社记者采访时指出,过去几年信创国产化发展很快,但也给客户造成了不少困扰,不同芯片厂商各自为战,形成了“烟囱式”的建设模式,导致算力利用率低下。“有这么多的芯片,都要去适配和优化,投入的成本非常多。”
为此,海光信息正在推进“AI计算开放架构”。吴宗友介绍,该架构没有加入门槛,旨在把所有的AI产业链上下游厂商聚合在一起,形成统一的开发规范,让客户不再被单一芯片绑定。
“国内各行各业尤其是互联网客户非常接受AI计算开放架构。”吴宗友透露,互联网客户购买力强,不希望被单一厂商控制,因此对开放路线接受度很高。
上述基流科技高管也表示,该公司研发的Venus智算平台能够兼容多种硬件架构,支持异构GPU,降低对进口GPU的依赖,同时能够实现高效混合训练与推理。
在硬件集群建设层面,挑战同样严峻。中科曙光(603019.SH)高级副总裁李斌告诉财联社记者,建设万卡集群并非简单的堆砌,随着规模扩大,互连网络、可靠性和能效都面临以指数级上升的工程难题。
李斌特别提到了当前行业热议的“光铜之争”,他认为,铜连接虽然成本低、功耗低,但传输距离受限。随着单链路速率提升至200G或400G,铜线传输距离缩短至厘米级,芯片直接出光成为必然趋势。
“为什么要用到CPU?因为现在光模块功耗高、可靠性差,十万卡规模如果全用光模块根本做不起来。”李斌分析,未来硅光和CPU技术成熟后,可以大幅提高可靠性并降低功耗。他预判,当速率超过400G时,没有"硅光技术"的系统可能无法实现。
为了解决异构算力的管理难题,云厂商正在尝试通过软件调度来抹平硬件差异。
丁振雷介绍,优刻得正在做异构管理和虚拟化能力,将不同算力切割得更细,把合适的负载调度到合适的位置。“原本大家采用不同类型的卡担忧很大,如果有统一标准,门槛会大大降低。”
从存储市场的投机乱象,到芯片供应的博弈,再到架构层面的突围,2026年的算力市场在焦虑与希望中开局。
对于国产厂商而言,上市融资只是获得了入场券,能否在“地狱模式”中通过技术和生态的考验,是未来两年必须解决的现实难题。
