算力租赁市场爆发,H20 遭疯抢!小心掉坑

从 2022 年起,美国开始持续收紧对华芯片的出口政策,而 H20 便是英伟达专为中国市场量身定制的 AI 芯片。今年以来,市场中的英伟达 H20 需求突然开始上涨。与此同时,市场中的算力服务器租赁需求也在爆发式的增长,更出现了 “一机难求” 的盛况。​

AI 服务器告急,H20 芯片需求大涨​

近期,许多上市公司纷纷发布公告,计划布局算力租赁市场。随着国产大模型的升级,算力租赁市场开始迎来高速增长,据某些算力中心人士预测,其今年的营收将比 2024 年增长三倍以上。​

与此同时,不少公司正在加紧采购算力服务器,尤其是高性能的算力服务器更是需求旺盛。例如莲花控股孙公司莲花紫星智算科技向中建投租赁 200 台高性能服务器,为期三年。​

有算力租赁分析师表示,从产业调研的情况来看,仅目前浮现的潜在大厂采购方可能接近 300 亿市场规模,预计中国 2025 年算力租赁市场规模有望超千亿。整体来看,2024 年我国 AI 服务器整体市场规模 190 亿美元,2025 年预期将达到 255 亿美元。​

不仅是国内,海外市场中,算力租赁同样火热。前不久英伟达被爆出将收购 Lepton AI,这是一家专门做搭载英伟达 AI 芯片服务器的公司,而此举被视为英伟达进军云计算和企业软件市场的一部分。巧合的是,就在这则消息被曝出不久后,近期市场中又传来谷歌公司正在洽谈租赁英伟达的 AI 服务器。​

算力租赁市场的火爆,也带动了市场中 AI 芯片的旺盛需求。以英伟达的 H20 为例,尽管该芯片作为英伟达专为中国量身定制的产品,并且其性能仅为 H100 的十分之一,但好在可以直接在中国售卖。​

有接近新华三的产业链人士透露,目前 141GB H20 基本被销售一空,而 96GB 版本也接近售罄,同时不知道未来何时能否再有供应,这需要取决于美国方面是否会放出相关禁令。​

据财联社报道,H20 的短缺情况从今年 2 月份便已有端倪,其中算力资源信息共享平台称 H20 咨询量为年前 3 倍,8 卡 H20 机器价格较年前涨价 10 万,单价已经达到了 110 万左右。市场中算力需求主要集中在英伟达的 H20,同时具有一定性价比的 4090 也受到了市场的青睐。​

而采购方主要来自于互联网大厂,例如阿里巴巴、腾讯、字节跳动等,共向英伟达订购了价值高达 160 亿美元的 H20 服务器芯片。其中阿里在 2 月中旬确认了与苹果 AI 进行合作,苹果官网显示,中文版 Apple Intelligence 将于 4 月上线,其采用的服务器支持便来自阿里。​

而腾讯方面也有相关人士透露,腾讯云已推出适配 H20 的四款面向不同场景的 DeepSeek 专属资源部署方案,并表示 H20 为性价比最优的选择。​

AI 算力市场,一时之间,好似又进入到了繁花似锦的阶段,尤其是目前 H20 的需求大增。其背后的原因在于 DeepSeek 的出现,以算法创新重构 AI 算力逻辑,让 AI 计算从训练为主转换到推理为主。虽然 H20 性能上有所下降,但做推理还是绰绰有余,显存足够,适合跑大规模的参数模型,价格也更低。​

租赁市场仍在,但不一定是 H20​

在过去,大模型的私有化部署成本昂贵,仅采购商业闭源模型这一项,就需要数百万乃至上千万。如果企业规模大,使用人数多,还需要采购多套模型,成本呈指数级上升。但随着开源的 DeepSeek 出现后,企业可以直接免费下载,模型成本直接归零,直接点燃了市场中做 AI 应用的热潮。​

同时,Deepseek 主要的一个优势就是计算成本大大降低,其语义识别能力和推理能力非常强大。有企业透露其匹配率提升了 20% 左右,成本降低超过 50%。​

当然,对于许多想要参与的中小型企业而言,自己建立数据中心可能需要数十亿的投入,还不如直接采用租赁的方式,这也是为何近期算力租赁市场愈发火爆的原因。​

但 H20 却不一定能一直伴随国内算力租赁市场的春风,自 2022 年起,美国先后将英伟达的 A100、H100、A800、H800 等高性能 AI 芯片列入对华出口禁令,这才让弱化版的 H20 被推出。而随着前段时间,美国商务部再次将多个中国企业纳入所谓的 “实体清单”,并进一步收紧 H20 的出口许可,未来甚至面临全面禁售。​

与此同时,中国发改委正在推行数据中心的能源效率新规,要求新建或扩建的数据中心采用 PUE (能源利用效率) 低于 1.5 和符合 “能效 / 算力比” 的芯片。H20 的能效表现显著低于华为昇腾、壁仞科技等国产芯片,例如壁仞科技的产品能效可以达到 H20 的 2 倍以上。​

加上目前国内 AI 企业已经开始认可华为昇腾、寒武纪、壁仞等本土芯片产品,同时优化算法以降低算力消耗。此前,DeepSeek 曾因算力不足暂停了 API 服务,也在倒逼行业加速构建自主算力生态。​

据 DeepSeek 研究人员的测试结果,推理任务中,昇腾 910C 性能可以达到 H100 的 60%。同时推理时代对于云计算、AI Infra 架构也有着全新的需求。​

此外,目前已经明确 2030 年前持续提升能效,H20 的高能耗特性使其在算力采购中被边缘化,面临被技术性淘汰的风险。​

尽管目前有消息显示,英伟达正在积极应对可能的禁令,同时计划修改 H20 芯片以符合中国能效标准,但这样一来性能可能会进一步下降,进一步推动企业采购国产 AI 芯片。虽然英伟达也可能通过租赁境外云算力,来间接服务中国客户,但这样成本较高。​

因此,大摩预计,2025 年中国本土 AI 芯片的市场份额将从 2024 年的 15% 提升至 25%。而这种影响是深刻的,以腾讯为例,尽管仍然在采购 H20,但腾讯也在加强芯片、模型、应用层的本土化协同,例如在其微信中集成 DeepSeek 模型时,还同步推进与本土芯片厂商的适配,减少对英伟达的长期依赖。​

一方面是悬而未决的禁令风险导致供应链的不稳定,另一方面是中国能效政策下的驱动。显然,DeepSeek 的出现固然推动了算力需求的增加,但 H20 未来的日子未必好过。​

总结​

在 DeepSeek 出现后,小微企业开始乘着 AI 应用的东风,算力租赁订单也呈爆发式增长。甚至一些企业还将大模型嵌入服务器中,降低企业的调试成本。H20 作为目前唯一可以买到的英伟达 AI 芯片,也被市场拉抬炒作。但随着中美双方博弈持续,如今 H20 的爆火,更多像是一场绚丽的烟花表演。

 

算力中心建设交付,请点击查看详细方案:https://aiforseven.com/delivery

 

算力集群运维解决方案:https://aiforseven.com/om

 

算力租赁需求请点击这里:https://aiforseven.com/leasing

 

AIGC应用定制解决方案:https://aiforseven.com/delivery

创建时间:2025-05-22 09:41
  • 极致性价比之选:七号智算8卡5090服务器与推理机深度解析

    如果说H200和B200是云端训练的皇冠,那么消费级旗舰显卡则是边缘推理和中小企业微调的利器。随着RTX 50系列显卡的发布,基于Blackwell架构消费版核心的8卡5090服务器迅速成为了市场上的“硬通货”。七号智算紧跟技术前沿,推出了针对该系列显卡的多元化解决方案,涵盖了5090推理机、5090一体机以及相关的技术优化服务。

    0 2026-05-28
  • 算力新纪元:七号智算引领H200、B200、B300算力租赁新潮流

    随着人工智能大模型参数量的指数级增长,算力已成为数字经济时代的“新石油”。然而,高昂的硬件成本与快速的技术迭代,让许多企业和开发者望而却步。在此背景下,算力租赁模式应运而生,成为打破算力壁垒的关键钥匙。作为行业内的佼佼者,七号智算凭借敏锐的市场洞察力和强大的资源整合能力,正在重新定义高性能计算资源的获取方式。

    0 2026-05-28
  • 2026 消费级 AI 算力革命,七号智算 8 卡 5090 服务器 / 推理机 / 一体机与 P2P 破解全解析

    2026 年,AI 推理需求爆发式增长,消费级高端显卡 RTX 5090 凭借单卡高性能,成为中小规模 AI 部署、模型微调、多模态生成的核心选择。七号智算紧跟市场热点,推出 8 卡 5090 服务器、5090 推理机、5090 一体机全系列产品,并通过 P2P 破解技术突破多卡通信瓶颈,释放消费级算力集群的极致性能,为企业与开发者提供高性价比、灵活部署的 AI 算力方案,推动 AI 技术普惠化发展。当前 RTX 5090 集群在中端推理场景性能接近专业卡,成本仅为数据中心 GPU 的 1/3,七号智算单品矩阵正重塑中小规模 AI 算力市场格局。

    0 2026-05-27
  • 2026 高端算力租赁爆发,七号智算 H200/B200/B300 集群重塑 AI 基础设施

    2026 年,AI 产业从模型竞赛转向行业深水区,算力需求呈指数级增长,高端 GPU 供需失衡加剧,算力租赁成为企业降本增效的核心选择。七号智算依托前沿资源布局与技术服务能力,构建 H200、B200、B300 全矩阵算力租赁体系,覆盖从主流推理到超大规模训练的全场景需求,成为驱动 AI 产业落地的核心算力引擎。当前国内高端智算缺口超 35%,H200、B200、B300 租赁市场供不应求,七号智算以稳定供给与定制化服务,破解企业算力焦虑,助力千行百业 AI 转型。

    1 2026-05-27

推荐文章