算力租赁市场爆发,H20 为何成新宠?

从 2022 年起,美国开始持续收紧对华芯片的出口政策,而 H20 便是英伟达专为中国市场量身定制的 AI 芯片。今年以来,市场中的英伟达 H20 需求突然开始上涨。与此同时,市场中的算力服务器租赁需求也在爆发式的增长,更出现了 “一机难求” 的盛况。​

AI 服务器告急,H20 芯片需求大涨​

近期,许多上市公司纷纷发布公告,计划布局算力租赁市场。随着国产大模型的升级,算力租赁市场开始迎来高速增长,据某些算力中心人士预测,其今年的营收将比 2024 年增长三倍以上。​

与此同时,不少公司正在加紧采购算力服务器,尤其是高性能的算力服务器更是需求旺盛。例如莲花控股孙公司莲花紫星智算科技向中建投租赁 200 台高性能服务器,为期三年。​

有算力租赁分析师表示,从产业调研的情况来看,仅目前浮现的潜在大厂采购方可能接近 300 亿市场规模,预计中国 2025 年算力租赁市场规模有望超千亿。整体来看,2024 年我国 AI 服务器整体市场规模 190 亿美元,2025 年预期将达到 255 亿美元。​

不仅是国内,海外市场中,算力租赁同样火热。前不久英伟达被爆出将收购 Lepton AI,这是一家专门做搭载英伟达 AI 芯片服务器的公司,而此举被视为英伟达进军云计算和企业软件市场的一部分。巧合的是,就在这则消息被曝出不久后,近期市场中又传来谷歌公司正在洽谈租赁英伟达的 AI 服务器。​

算力租赁市场的火爆,也带动了市场中 AI 芯片的旺盛需求。以英伟达的 H20 为例,尽管该芯片作为英伟达专为中国量身定制的产品,并且其性能仅为 H100 的十分之一,但好在可以直接在中国售卖。​

有接近新华三的产业链人士透露,目前 141GB H20 基本被销售一空,而 96GB 版本也接近售罄,同时不知道未来何时能否再有供应,这需要取决于美国方面是否会放出相关禁令。​

据财联社报道,H20 的短缺情况从今年 2 月份便已有端倪,其中算力资源信息共享平台称 H20 咨询量为年前 3 倍,8 卡 H20 机器价格较年前涨价 10 万,单价已经达到了 110 万左右。市场中算力需求主要集中在英伟达的 H20,同时具有一定性价比的 4090 也受到了市场的青睐。​

而采购方主要来自于互联网大厂,例如阿里巴巴、腾讯、字节跳动等,共向英伟达订购了价值高达 160 亿美元的 H20 服务器芯片。其中阿里在 2 月中旬确认了与苹果 AI 进行合作,苹果官网显示,中文版 Apple Intelligence 将于 4 月上线,其采用的服务器支持便来自阿里。​

而腾讯方面也有相关人士透露,腾讯云已推出适配 H20 的四款面向不同场景的 DeepSeek 专属资源部署方案,并表示 H20 为性价比最优的选择。​

AI 算力市场,一时之间,好似又进入到了繁花似锦的阶段,尤其是目前 H20 的需求大增。其背后的原因在于 DeepSeek 的出现,以算法创新重构 AI 算力逻辑,让 AI 计算从训练为主转换到推理为主。虽然 H20 性能上有所下降,但做推理还是绰绰有余,显存足够,适合跑大规模的参数模型,价格也更低。​

租赁市场仍在,但不一定是 H20​

在过去,大模型的私有化部署成本昂贵,仅采购商业闭源模型这一项,就需要数百万乃至上千万。如果企业规模大,使用人数多,还需要采购多套模型,成本呈指数级上升。但随着开源的 DeepSeek 出现后,企业可以直接免费下载,模型成本直接归零,直接点燃了市场中做 AI 应用的热潮。​

同时,Deepseek 主要的一个优势就是计算成本大大降低,其语义识别能力和推理能力非常强大。有企业透露其匹配率提升了 20% 左右,成本降低超过 50%。​

当然,对于许多想要参与的中小型企业而言,自己建立数据中心可能需要数十亿的投入,还不如直接采用租赁的方式,这也是为何近期算力租赁市场愈发火爆的原因。​

但 H20 却不一定能一直伴随国内算力租赁市场的春风,自 2022 年起,美国先后将英伟达的 A100、H100、A800、H800 等高性能 AI 芯片列入对华出口禁令,这才让弱化版的 H20 被推出。而随着前段时间,美国商务部再次将多个中国企业纳入所谓的 “实体清单”,并进一步收紧 H20 的出口许可,未来甚至面临全面禁售。​

与此同时,中国发改委正在推行数据中心的能源效率新规,要求新建或扩建的数据中心采用 PUE (能源利用效率) 低于 1.5 和符合 “能效 / 算力比” 的芯片。H20 的能效表现显著低于华为昇腾、壁仞科技等国产芯片,例如壁仞科技的产品能效可以达到 H20 的 2 倍以上。​

加上目前国内 AI 企业已经开始认可华为昇腾、寒武纪、壁仞等本土芯片产品,同时优化算法以降低算力消耗。此前,DeepSeek 曾因算力不足暂停了 API 服务,也在倒逼行业加速构建自主算力生态。​

据 DeepSeek 研究人员的测试结果,推理任务中,昇腾 910C 性能可以达到 H100 的 60%。同时推理时代对于云计算、AI Infra 架构也有着全新的需求。​

此外,目前已经明确 2030 年前持续提升能效,H20 的高能耗特性使其在算力采购中被边缘化,面临被技术性淘汰的风险。​

尽管目前有消息显示,英伟达正在积极应对可能的禁令,同时计划修改 H20 芯片以符合中国能效标准,但这样一来性能可能会进一步下降,进一步推动企业采购国产 AI 芯片。虽然英伟达也可能通过租赁境外云算力,来间接服务中国客户,但这样成本较高。​

因此,大摩预计,2025 年中国本土 AI 芯片的市场份额将从 2024 年的 15% 提升至 25%。而这种影响是深刻的,以腾讯为例,尽管仍然在采购 H20,但腾讯也在加强芯片、模型、应用层的本土化协同,例如在其微信中集成 DeepSeek 模型时,还同步推进与本土芯片厂商的适配,减少对英伟达的长期依赖。​

一方面是悬而未决的禁令风险导致供应链的不稳定,另一方面是中国能效政策下的驱动。显然,DeepSeek 的出现固然推动了算力需求的增加,但 H20 未来的日子未必好过。​

在 DeepSeek 出现后,小微企业开始乘着 AI 应用的东风,算力租赁订单也呈爆发式增长。甚至一些企业还将大模型嵌入服务器中,降低企业的调试成本。H20 作为目前唯一可以买到的英伟达 AI 芯片,也被市场拉抬炒作。但随着中美双方博弈持续,如今 H20 的爆火,更多像是一场绚丽的烟花表演。​

 

算力中心建设交付,请点击查看详细方案:https://aiforseven.com/delivery

 

算力集群运维解决方案:https://aiforseven.com/om

 

算力租赁需求请点击这里:https://aiforseven.com/leasing

 

AIGC应用定制解决方案:https://aiforseven.com/delivery

创建时间:2025-05-29 09:23
  • 8 卡 5090 服务器爆火!推理机、一体机全面内卷,P2P 破解为何成行业暗战焦点

    随着大模型应用持续爆发,5090 系列的部署形态还将持续迭代,P2P 技术与合规化方案的博弈,也会长期贯穿整个算力市场。

    0 2026-04-16
  • 算力租赁黄金时代:H200 租赁、B200 租赁、B300 租赁如何重构 AI 产业格局

    算力租赁是 AI 时代的 “数字水电”,而H200 租赁、B200 租赁、B300 租赁则是其中的 “特高压电网”,支撑着大模型与 AI 应用的核心运转。2026 年,行业正处于 “供需失衡、模式升级、格局集中” 的关键转折点,掌握高端算力资源的头部厂商,将在 AI 产业浪潮中占据核心话语权。

    对企业而言,选择算力租赁而非自建,是效率与成本的最优解;选择H200/B200/B300 租赁,则是抢占 AI 技术高地的战略抉择 —— 在算力即生产力的时代,谁拥有更优质、更充足的高端算力,谁就能在 AI 竞争中赢得先机。

    0 2026-04-16
  • 8卡5090服务器、5090推理机、5090一体机全解析:P2P破解的性能诱惑与合规陷阱

    在生成式AI普及、大模型本地化部署提速的当下,英伟达RTX 5090凭借Blackwell架构加持、32GB GDDR7大显存、强悍的AI推理与并行算力,成为中高端算力场景的性价比首选。围绕这款消费级旗舰显卡,行业内衍生出8卡5090服务器、5090推理机、5090一体机三大核心算力形态,覆盖从企业级集群训练、商业化大模型推理到个人/小型团队本地AI部署的全场景需求。而多卡协同效率的核心瓶颈——P2P直连功能,让P2P破解成为行业热议话题:一边是破解后算力利用率的翻倍提升,一边是合规、稳定性与售后的多重隐患,成为所有5090算力用户必须厘清的关键命题。

    1 2026-04-14
  • 算力租赁新生态:H200 租赁、B200 租赁、B300 租赁,解锁 AI 大模型时代的顶级算力自由

    在 AI 大模型参数从百亿、千亿迈向万亿级,全球 Token 日调用量突破 140 万亿的当下,算力已成为数字经济的核心生产资料。面对英伟达 H200、B200、B300 等顶级数据中心 GPU现货稀缺、采购溢价高、交付周期长的行业困境,算力租赁正以 “即租即用、弹性扩容、成本可控” 的绝对优势,成为 AI 企业、科研机构、初创团队获取顶级算力的首选路径。其中,H200 租赁、B200 租赁、B300 租赁作为当前算力市场的 “三大顶流”,分别对应主流大模型、超大规模模型、万亿参数级模型的全生命周期需求,构建起覆盖训练、微调、推理的完整算力服务生态,让每一个 AI 创新者都能跳过硬件壁垒,直接站上全球顶级算力的起跑线。

    2 2026-04-14

推荐文章