算力租赁市场爆发，H20 遭疯抢！小心掉坑-七号智算

从 2022 年起，美国开始持续收紧对华芯片的出口政策，而 H20 便是英伟达专为中国市场量身定制的 AI 芯片。今年以来，市场中的英伟达 H20 需求突然开始上涨。与此同时，市场中的算力服务器租赁需求也在爆发式的增长，更出现了 “一机难求” 的盛况。

AI 服务器告急，H20 芯片需求大涨

近期，许多上市公司纷纷发布公告，计划布局算力租赁市场。随着国产大模型的升级，算力租赁市场开始迎来高速增长，据某些算力中心人士预测，其今年的营收将比 2024 年增长三倍以上。

与此同时，不少公司正在加紧采购算力服务器，尤其是高性能的算力服务器更是需求旺盛。例如莲花控股孙公司莲花紫星智算科技向中建投租赁 200 台高性能服务器，为期三年。

有算力租赁分析师表示，从产业调研的情况来看，仅目前浮现的潜在大厂采购方可能接近 300 亿市场规模，预计中国 2025 年算力租赁市场规模有望超千亿。整体来看，2024 年我国 AI 服务器整体市场规模 190 亿美元，2025 年预期将达到 255 亿美元。

不仅是国内，海外市场中，算力租赁同样火热。前不久英伟达被爆出将收购 Lepton AI，这是一家专门做搭载英伟达 AI 芯片服务器的公司，而此举被视为英伟达进军云计算和企业软件市场的一部分。巧合的是，就在这则消息被曝出不久后，近期市场中又传来谷歌公司正在洽谈租赁英伟达的 AI 服务器。

算力租赁市场的火爆，也带动了市场中 AI 芯片的旺盛需求。以英伟达的 H20 为例，尽管该芯片作为英伟达专为中国量身定制的产品，并且其性能仅为 H100 的十分之一，但好在可以直接在中国售卖。

有接近新华三的产业链人士透露，目前 141GB H20 基本被销售一空，而 96GB 版本也接近售罄，同时不知道未来何时能否再有供应，这需要取决于美国方面是否会放出相关禁令。

据财联社报道，H20 的短缺情况从今年 2 月份便已有端倪，其中算力资源信息共享平台称 H20 咨询量为年前 3 倍，8 卡 H20 机器价格较年前涨价 10 万，单价已经达到了 110 万左右。市场中算力需求主要集中在英伟达的 H20，同时具有一定性价比的 4090 也受到了市场的青睐。

而采购方主要来自于互联网大厂，例如阿里巴巴、腾讯、字节跳动等，共向英伟达订购了价值高达 160 亿美元的 H20 服务器芯片。其中阿里在 2 月中旬确认了与苹果 AI 进行合作，苹果官网显示，中文版 Apple Intelligence 将于 4 月上线，其采用的服务器支持便来自阿里。

而腾讯方面也有相关人士透露，腾讯云已推出适配 H20 的四款面向不同场景的 DeepSeek 专属资源部署方案，并表示 H20 为性价比最优的选择。

AI 算力市场，一时之间，好似又进入到了繁花似锦的阶段，尤其是目前 H20 的需求大增。其背后的原因在于 DeepSeek 的出现，以算法创新重构 AI 算力逻辑，让 AI 计算从训练为主转换到推理为主。虽然 H20 性能上有所下降，但做推理还是绰绰有余，显存足够，适合跑大规模的参数模型，价格也更低。

租赁市场仍在，但不一定是 H20

在过去，大模型的私有化部署成本昂贵，仅采购商业闭源模型这一项，就需要数百万乃至上千万。如果企业规模大，使用人数多，还需要采购多套模型，成本呈指数级上升。但随着开源的 DeepSeek 出现后，企业可以直接免费下载，模型成本直接归零，直接点燃了市场中做 AI 应用的热潮。

同时，Deepseek 主要的一个优势就是计算成本大大降低，其语义识别能力和推理能力非常强大。有企业透露其匹配率提升了 20% 左右，成本降低超过 50%。

当然，对于许多想要参与的中小型企业而言，自己建立数据中心可能需要数十亿的投入，还不如直接采用租赁的方式，这也是为何近期算力租赁市场愈发火爆的原因。

但 H20 却不一定能一直伴随国内算力租赁市场的春风，自 2022 年起，美国先后将英伟达的 A100、H100、A800、H800 等高性能 AI 芯片列入对华出口禁令，这才让弱化版的 H20 被推出。而随着前段时间，美国商务部再次将多个中国企业纳入所谓的 “实体清单”，并进一步收紧 H20 的出口许可，未来甚至面临全面禁售。

与此同时，中国发改委正在推行数据中心的能源效率新规，要求新建或扩建的数据中心采用 PUE (能源利用效率) 低于 1.5 和符合 “能效 / 算力比” 的芯片。H20 的能效表现显著低于华为昇腾、壁仞科技等国产芯片，例如壁仞科技的产品能效可以达到 H20 的 2 倍以上。

加上目前国内 AI 企业已经开始认可华为昇腾、寒武纪、壁仞等本土芯片产品，同时优化算法以降低算力消耗。此前，DeepSeek 曾因算力不足暂停了 API 服务，也在倒逼行业加速构建自主算力生态。

据 DeepSeek 研究人员的测试结果，推理任务中，昇腾 910C 性能可以达到 H100 的 60%。同时推理时代对于云计算、AI Infra 架构也有着全新的需求。

此外，目前已经明确 2030 年前持续提升能效，H20 的高能耗特性使其在算力采购中被边缘化，面临被技术性淘汰的风险。

尽管目前有消息显示，英伟达正在积极应对可能的禁令，同时计划修改 H20 芯片以符合中国能效标准，但这样一来性能可能会进一步下降，进一步推动企业采购国产 AI 芯片。虽然英伟达也可能通过租赁境外云算力，来间接服务中国客户，但这样成本较高。

因此，大摩预计，2025 年中国本土 AI 芯片的市场份额将从 2024 年的 15% 提升至 25%。而这种影响是深刻的，以腾讯为例，尽管仍然在采购 H20，但腾讯也在加强芯片、模型、应用层的本土化协同，例如在其微信中集成 DeepSeek 模型时，还同步推进与本土芯片厂商的适配，减少对英伟达的长期依赖。

一方面是悬而未决的禁令风险导致供应链的不稳定，另一方面是中国能效政策下的驱动。显然，DeepSeek 的出现固然推动了算力需求的增加，但 H20 未来的日子未必好过。

总结

在 DeepSeek 出现后，小微企业开始乘着 AI 应用的东风，算力租赁订单也呈爆发式增长。甚至一些企业还将大模型嵌入服务器中，降低企业的调试成本。H20 作为目前唯一可以买到的英伟达 AI 芯片，也被市场拉抬炒作。但随着中美双方博弈持续，如今 H20 的爆火，更多像是一场绚丽的烟花表演。

算力中心建设交付，请点击查看详细方案：https://aiforseven.com/delivery

算力集群运维解决方案：https://aiforseven.com/om

算力租赁需求请点击这里：https://aiforseven.com/leasing

AIGC应用定制解决方案：https://aiforseven.com/delivery

创建时间：2025-05-22 09:41

8 卡 5090 服务器、5090 推理机、5090 一体机技术解析，P2P 破解优化多卡协同效能

大模型推理、AIGC 图像渲染、小规模模型微调市场持续升温，消费级高端 GPU 集群凭借突出性价比受到市场青睐，8 卡 5090 服务器、5090 推理机、5090 一体机成为中小 AI 团队主流硬件方案。多卡并行场景下，卡间通信瓶颈长期制约整机算力释放，P2P 破解技术成为行业重点优化方向。七号智算长期深耕 5090 整机方案搭建与底层性能调优，结合大量落地案例，系统拆解三款硬件定位、架构特点，以及 P2P 破解的技术原理、落地价值与实践注意事项。

넶0 2026-07-23
算力租赁需求持续爆发，H200 租赁、B200 租赁、B300 租赁如何赋能大模型产业落地

随着多模态大模型、智能体应用持续落地，全球高端 AI 算力供需缺口不断扩大，算力租赁模式成为众多 AI 企业降本增效的主流选择。H200 租赁、B200 租赁、B300 租赁作为当前市场关注度最高的高端算力服务，支撑起大模型预训练、微调、长文本推理、视频生成等核心业务。七号智算深耕算力租赁赛道，依托标准化算力集群部署与灵活租赁方案，为初创 AI 团队、行业解决方案厂商、科研机构提供稳定可落地的高端算力支撑，适配当下 AI 产业高速发展的时代热点。

넶0 2026-07-23
8 卡 5090 服务器、5090 推理机、5090 一体机技术解析，P2P 破解优化方案赋能中小 AI 团队，七号智算输出轻量化算力方案

大模型商业化落地进入深水区，除高端训练算力之外，性价比突出的推理算力迎来爆发窗口。以 RTX 5090 为核心硬件的 8 卡 5090 服务器、5090 推理机、5090 一体机快速普及，成为中小企业、工作室、垂直行业开发者搭建私有化算力的主流载体。受制于原厂产品策略，消费级多卡集群原生存在 P2P 通信限制，P2P 破解优化成为释放整机算力的关键技术手段。七号智算持续深耕 5090 系列硬件部署与底层调优，面向推理、轻量化微调、AIGC 内容生产场景提供成熟可行的算力部署方案。

넶2 2026-07-22
高端算力租赁需求持续爆发，H200 租赁、B200 租赁、B300 租赁成为大模型赛道核心选择，七号智算打造弹性算力支撑体系

随着多模态大模型、智能体、AI 视频生成产业持续落地，国内算力市场迎来结构性变革，算力租赁从早期辅助配套转变为 AI 企业标准化基础设施。2026 年行业显著特征在于，高端训练算力供给持续紧张，H200 租赁、B200 租赁、B300 租赁需求同步走高，大量模型研发企业放弃重资产自建模式，选择算力租赁快速补齐算力缺口。七号智算紧跟行业热点，持续完善高端 GPU 算力集群布局，面向科研机构、AI 创业公司、行业数字化服务商提供全周期弹性算力租赁服务。

넶2 2026-07-22

算力租赁市场爆发，H20 遭疯抢！小心掉坑

8 卡 5090 服务器、5090 推理机、5090 一体机技术解析，P2P 破解优化多卡协同效能

算力租赁需求持续爆发，H200 租赁、B200 租赁、B300 租赁如何赋能大模型产业落地

8 卡 5090 服务器、5090 推理机、5090 一体机技术解析，P2P 破解优化方案赋能中小 AI 团队，七号智算输出轻量化算力方案

高端算力租赁需求持续爆发，H200 租赁、B200 租赁、B300 租赁成为大模型赛道核心选择，七号智算打造弹性算力支撑体系