“AI时代,大模型将是下一代操作系统,超级AI云是下一代计算机。”9月24日,在2025云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭抛出这一惊人论断,当下行业处于“自主行动”阶段,AI掌握工具使用和编程能力以“辅助人”。他认为实现通用人工智能AGI已是确定性事件,但这只是起点,终极目标是发展出能自我迭代、全面超越人类的超级人工智能ASI。
红星新闻记者了解到,此次云栖大会,阿里云已升级为全栈人工智能服务商,全面升级的阿里云AI基础设施重磅亮相,而更加显著的一个趋势是,百炼平台已有超20万开发者开发了80多万个Agent(智能体)。同时,通义灵码插件下载量已超2200万,累计为开发者生成超60亿行代码,AI正在加速渗透千行百业,无处不在。
AI时代大模型将是下一代操作系统 要做全栈人工智能服务商
吴泳铭宣布阿里云重磅升级全栈AI体系,实现从AI大模型到AI基础设施的技术更新。面向新一轮智能革命,阿里云将全力打造成为全栈人工智能服务商。
全栈人工智能服务商,简单来说,这意味着阿里云的目标是将软硬件全面整合。它要从最底层的芯片、机房,到中间的分布式训练平台、大模型家族,再到上层的Agent智能体、行业解决方案,最后贯穿生态与商业化工具,形成端到端的交付与运维闭环。
吴泳铭认为,超级AI云需要超大规模的基础设施和全栈的技术积累,未来,全世界可能只会有5~6个超级云计算平台。阿里云将持续加大投入,迎接超级人工智能时代到来。
随着AI的发展,AI也有望替代能源成为最重要商品,token将成未来“电”。阿里云则将积极推进3800亿AI基础设施建设,预计到2032年,阿里云其全球数据中心能耗规模较2022年AI元年提升10倍。
左手大模型右手AI基础设施阿里云要打造AI超级计算机
2025云栖大会现场,堪称云计算领域的一次“沙场秋点兵”。全面升级的阿里云AI基础设施重磅亮相,全面展示了阿里云从底层芯片、超节点服务器、高性能网络、分布式存储、智算集群到人工智能平台、模型训练推理服务的全栈AI技术能力。
通义大模型7连发,在模型智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。在大语言模型中,阿里通义家族全面亮相:旗舰模型Qwen3-Max性能超过GPT5、Claude Opus 4等,跻身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)两大版本,其预览版已在 Chatbot Arena 排行榜上位列第三。
在服务器层面,阿里云发布全新一代磐久128超节点AI服务器。由阿里云自主研发设计,具备高密度、高性能和高可用的核心优势,可高效支持多种AI芯片,单柜支持128个AI计算芯片,密度刷新业界纪录。
磐久AI Infra2.0 128超节点服务器
在网络层面,阿里云新一代高性能网络HPN 8.0全新亮相。为应对大模型时代对海量数据传输的需求,HPN8.0采用训推一体化架构,存储网络带宽拉升至800Gbps,GPU互联网络带宽达到6.4Tbps,可支持单集群10万卡GPU高效互联,为万卡大集群提供高性能、确定性的云上基础网络,助力AI训推提效。
在存储层面,阿里云分布式存储面向AI需求全面升级。高性能并行文件存储CPFS单客户端吞吐提升至40GB/s, 可满足AI训练对快速读取数据的极致需求在AI智算集群层面,智能计算灵骏集群通过多级亲和性与拓扑感知调度设计,基于HPN 网络支持10万卡稳定互联,多级可扩展的架构让每张卡间互联路径更短、带宽更优。
AI需求爆发也带动了通用算力需求上升,阿里云通用计算全面升级。依托自研的“飞天+CIPU”架构体系,阿里云第九代企业级实例采用英特尔、AMD的最新芯片,在大幅提升算力水平的同时,可为Agent提供稳定、安全、高性能的通用CPU算力。
为AI负载提供弹性、调度优化和规模化运行的容器计算,也迎来重磅升级。容器服务ACK新增灵骏节点池,引入模型感知智能路由、多角色推理负载管理、故障自愈等核心功能,自动处理恢复时长缩短了 85% ,模型推理冷启动提速10倍.....
阿里云人工智能平台PAI与通义大模型联合优化,印证了全栈AI的“1+1>2”的效果。在训练层,针对MoE模型,采用统一调度机制、自适应计算通信掩盖、EP计算负载均衡和计算显存分离式并行等优化手段,使得通义千问模型训练端到端加速比提升3倍以上。
“阿里云正在全力打造一台全新的AI超级计算机,它同时拥有最领先的AI基础设施和最领先的模型,两者可以在产品设计和运行架构上高度协同,从而确保在阿里云上调用和训练通义千问模型时,能达到最高效率。”吴泳铭表示。
Agent为入口 阿里云AI已渗透到各行各业
当前中国GenAI正处于高速渗透和规模化应用阶段。阿里云正通过行业AI策略,将技术深度融入具体场景。Agent作为最重要的工具之一,已经大量进入人类生活和工作。阿里云智能集团通义大模型业务总经理徐栋表示,“很少遇到企业没用大模型,随着模型能力的不断提升以及Agent应用的爆发,过去一年,阿里云百炼平台的模型日均调用量增长了15倍。”
在2025云栖大会上,随处可见硅基生物,碳基共生,Agent落地将是未来主旋律。恒瑞医药旗下医朵云——“朵朵”临研助手,就是基于Qwen3、Qwen-VL,深度整合临床试验全流程数据,实现受试者智能筛选、不良反应精准预警及医学文档自动生成,大幅提升临床试验效率,为医药研发领域带来新的变革。
据中国工商银行金融科技部副总经理金海旻介绍,工商银行基于通义千问多模态大模型推出了“商户智能审核助手”,在商户准入审核环节,用多模态技术取代传统OCR技术,展现出强大的业务价值。
网易集团执行副总裁、网易雷火事业群负责人胡志鹏也介绍了Agent对AI游戏的重要提升,网易借助Qwen3-coder等模型正在推动AI辅助智能生成代码,打造自动游戏测试体系,并通过调用工具实现游戏画面实时显示,这一过程帮助游戏开发提效50%。
特别值得一提的是,在场景最为复杂丰富的制造业中,各式各样的Agent纷纷落地。
Agent已成为AI时代的入口。为了让模型可以被更好地使用,AI编程能力不可或缺。通义灵码是国内最受欢迎的辅助编程工具,正在帮助金融、汽车、企业服务等领域的企业提速。
中国建设银行旗下的建信金科引入通义灵码赋能研发全流程,助力开发人员的研发智能化,代码智能生成采纳率超30%,显著提升研发团队开发效率与工程规范性;平安集团超1.5万名研发工程师已在使用AI编码,覆盖平安集团旗下银行、保险、科技等核心业务线,部分新项目的代码AI生成占比超70%。
吉利汽车超1500+位研发正在使用通义灵码,代码中AI生成占比超30%,尤其在通用代码逻辑开发、代码检查测试等环节,代码帮助开发效率提升超20%。
全栈AI服务玩家屈指可数 3800亿投入AI基础设施
2025年云栖大会很可能是AI变革历史上的最重要的一页注脚。从云计算到大模型,再到应用Agent,阿里云的领先,不单体现在单个组件的性能指标上,更体现在其构建“下一代计算机”的完整架构思考和全栈协同能力上。这一套被彻底重构的AI原生基础设施,已为其自身的通义大模型家族提供了强劲的动力,也为其服务中国百万级开发者和企业提供了坚实的底气。
一位资深行业分析师认为,全球范围内,真正有能力提供全栈AI服务的玩家屈指可数。主要是亚马逊的AWS、微软的Azure、谷歌的GCP,以及阿里云。它们之间的竞争,本质上是AI时代操作系统的争夺战。“这不再是一个单纯的中国市场竞争,而是一场全球性的科技竞赛。”
牌桌上的数字比言论更具有说服力。日前,国际市场调研机构沙利文(Frost&Sullivan)发布《中国GenAI市场洞察:企业级⼤模型调⽤全景研究,2025》报告,2025年上半年,阿里通义成为目前中国企业选择最多的大模型。国际权威市场调研机构Omdia发布《中国企业GenAI(生成式AI)采用格局,2025H1》报告,超7成的《财富》中国 500 强企业已采用GenAI,其中,阿里云渗透率排名第一。
截至目前,阿里云运营着中国第一、全球领先的AI基础设施和云计算网络,在全球29个地域设有90个可用区。三方机构Omdia2025年上半年数据显示,中国AI云市场阿里云占比35.8%,超过2到4名总和;在已采用生成式AI的财富中国500强中,超53%企业选择阿里云,渗透率位列第一。未来3年,阿里巴巴将投入3800亿用于建设云和AI基础设施,总额超过过去十年的总和。
在AI时代打造最坚实的水电煤数字基建,属于阿里云AI的故事可能刚刚开始。
红星新闻记者 胡沛