硬件、模型和智能体,AWS正驱动AI大时代

最近这两年在说到“云计算”时,大多数人首先想到已经不再是更快的云端CPU、更大的互联网带宽,或者是更大的云端存储空间。原因很简单,因为蓬勃发展的AI技术已经改变了许多人对于“云”的主要需求。现在开发者普遍更关注的话题变成了如何更有效地使用那些云端AI工具、训练属于自己的智能体,或者是利用云计算的弹性来最大化企业AI服务的性价比。

硬件、模型和智能体,AWS正在驱动AI“大时代”

但我们都知道AI技术最突出的两大特征,一是在于它发展得如此之快,新的模型层出不穷,造成了硬件反而被快速淘汰,开发者们也因此目不暇接。其二就是如今的AI已经呈现出各种各样的隐患,从使用成本到隐私保护、从信息治理到AI言行“越界”的监测,这些无疑都挑战着开发者的智慧,同时也提高了企业使用AI的潜在成本。


很显然,整个行业都需要有一套新的体系来支撑AI技术的继续健康发展。而这既包括新的算力硬件,也包含新的模型、新的开发环境、新的运营工具。

硬件、模型和智能体,AWS正在驱动AI“大时代”

2025年12月初,AWS成为了最早“站出来”解决相关问题的云计算厂商。当地时间2025年12月2日,就在AWS re:Invent 2025的第二天,AWS CEO Matt Garman系统性地阐释了他们应对未来AI需求的全栈生态实力。


更强大的自研硬件,为AI训练“减负”


熟悉AWS的朋友都知道,自研芯片长期以来一直都是其实现超高性能和性价比的关键所在,这一点在AI时代同样成立。

硬件、模型和智能体,AWS正在驱动AI“大时代”

就在此次活动开场后不久,Matt Garman就披露了AWS的最新款的自研AI训练芯片Trainium 3。根据官方公布的信息显示,Trainium 3基于3nm制程打造,能效比上代提高了40%,性能更是达到前代的2倍。

硬件、模型和智能体,AWS正在驱动AI“大时代”

同时AWS在现场也展示了基于Trainium 3的“UltraServers”机架。这套系统拥有4.4倍于前代训练服务器的性能、3.9倍于前代的内存带宽,并在生成Tokens的能效上达到了前代的5倍之多。

硬件、模型和智能体,AWS正在驱动AI“大时代”

但AWS的硬件进步尚未停止,他们还首次披露了下一代的Trainium 4。这款尚在开发中的次时代训练芯片将会带来6倍的性能水准,2倍的内存容量。更为值得关注的,是其将可以支持NVIDIA NVLink Fusion技术,也就是实现AWS自研芯片与NVIDIA AI芯片的“协同工作”。

硬件、模型和智能体,AWS正在驱动AI“大时代”

从这一点来看,AWS的自研芯片显然并非是为了完全取代第三方的AI加速器硬件。相反,AWS早已成为能提供最多种类云计算实例的品牌。就在此次活动中,Matt Garman也一口气公布了基于NVIDIA、AMD、Intel,甚至是苹果M系芯片的多款新计算实例。

硬件、模型和智能体,AWS正在驱动AI“大时代”

值得注意的是,尽管我们三易生活已经提前了解到关于新一代Graviton处理器的相关信息,但Matt Garman在这次演讲中却并没有提及。这或许是因为相比只能用于AI任务的Trainium,Graviton显然更加“通用”。接下来我们也会持续关注AWS新一代通用处理器的信息,并在第一时间为大家带来相关报道。


更多AI模型选择,自研Nova家族大升级


讲完硬件部分,Matt Garman就开始探讨模型选择在AI开发过程中的重要作用。对于AWS而言,他们则提供了Bedrock。这是一个“应用商店”式的模型选择和AI程序优化工具,开发者可以在AWS的云端服务器上选择来自多个不同提供方的AI模型,同时也可以借助其来定制、优化他们的AI应用程序。

硬件、模型和智能体,AWS正在驱动AI“大时代”

Matt Garman公布的相关数据显示,Bedrock已经成为一些行业巨头AI服务背后的“贤内助”。有超过50家AWS的客户在Bedrock上处理超过1万亿数量级的Tokens。

硬件、模型和智能体,AWS正在驱动AI“大时代”

同时Bedrock也在不断地增强自身的“包容性”,今天AWS方面就正式宣布,来自谷歌、Kimi、MINIMAX和NVIDIA等多个企业的18款新模型在Bedrock“上架”。很显然,这也直接证明了如今Bedrock在AI开发领域的“行业地位”。

硬件、模型和智能体,AWS正在驱动AI“大时代”

当然,Bedrock并非只依赖于第三方的模型,因为AWS也有自研Nova模型家族。如今,Nova已经扩展到了多达8个不同领域的分支版本。

硬件、模型和智能体,AWS正在驱动AI“大时代”

今天AWS方面也正式公布了全新的Nova 2家族。目前提供四种分支版本,其中Lite适用于快速、高性价比的日常负载,Sonic专注于实时语言对话,Pro具有AWS迄今为止最高的智能推理能力,Omini更是成为了业内首款统一的多模态生成和推理模型。

硬件、模型和智能体,AWS正在驱动AI“大时代”

AWS方面公布的信息显示,与Claude Sonnet 4.5、GPT-5.1、Gemini 2.5 Pro等对手相比,Nova 2 Pro在实测中能够做到多项指标显著领先。而Nova 2 Omni作为业内首个可接受文本、图像、视频和语音输入,并同时生成文本和图像的AI模型,能够“一口气”处理多达75万单词的文本、数小时的音频或视频,这就意味着它可以被用于非常复杂的产品分析,从而为更“全能”的AI应用打下了基础。


为了AI应用的长期“成长”,AWS端出新玩意


正如本文一开始就提及的那样,如今AI技术的一大特征就是更新换代特别迅速,这自然就会为开发者带来更大的挑战。Matt Garman将其比喻为养育孩子,(开发者)总是想要确保(AI应用)成长和取得成功,而不是去犯错、“惹麻烦”,要想实现这一点,更加智能的工具便可以提供很大的帮助。

硬件、模型和智能体,AWS正在驱动AI“大时代”

比如AWS Transform得到了进一步的升级。这是一个用于将老旧代码自动“现代化”的智能体。现在它加入了自定义特性,开发者只需一句话、一个命令,就能将过时的程序自动使用新版本的代码进行“重写”。请注意,这与单纯的“AI编程”并不一样,它并非完全靠智能体“无中生有”,而是可以学习原版程序的编程思路,对于一些已经长期停止更新,甚至开发者都放弃维护了的软件来说,它就显然尤为可贵。

硬件、模型和智能体,AWS正在驱动AI“大时代”

当然,AI不只可以用于解决企业潜在的技术债务,它们本身也需要具备能够持续进化的能力。这就是为何AWS在此次活动临近结束时,一口气发布了多款旨在帮助开发者实现“长期主义”的AI智能体,也就是“Frontier Agents”的原因。

硬件、模型和智能体,AWS正在驱动AI“大时代”

首先,AWS方面介绍了新的Kiro开发智能体,它允许开发者用自然语言描述功能需求,并自动生成代码。很显然,它的作用是减少开发团队的工作量,同时也可以避免代码编写过程中的人为错误。

硬件、模型和智能体,AWS正在驱动AI“大时代”

此外,我们也迎来了AWS安全智能体,它可以主动扫描代码中的漏洞,甚至代替人工执行渗透测试。这样一来,一方面安全人员可以大幅减少枯燥的工作,另一方面也使得开发者可以从一开始就编写出更安全稳定的代码,而不是在程序上线后再去“考验”它们。

硬件、模型和智能体,AWS正在驱动AI“大时代”

当然,对于已经上线的服务,AWS也推出了DevOps运维智能体,可以主动发现软件故障、提供解决方案建议。用AWS的话来说,它可以让软件团队“多睡一会儿”。


需要注意的是,这三款智能体并非缺乏经验的“新兵”。据AWS方面透露,在正式上线前,它们实际上已经参与了AWS Bedrock的重构工作。当时他们仅用一个6到8人的团队,在智能体的帮助下,几个月时间就完成了过去可能需要更大规模团队一年才能搞定的工作量。


全身心投入AI大时代,AWS有这个底气


纵观re:Invent 2025的首场主题演讲不难发现,AWS几乎是将全部的“资源”都倾斜给了AI、智能体。事实上,直到最后的10分钟,Matt Garman才以极快的节奏,介绍了AWS在AI之外、多达25个业务和功能更新,而这些涉及数据库、通用计算实例的信息,过去曾都做过re:Invent的“主角”。

硬件、模型和智能体,AWS正在驱动AI“大时代”

当然,AWS确实有这样去做的底气。一方面,他们在过去一年取得了惊人的1320亿美元营收,同时Amazon S3、AWS全球基础设施等“传统业务”依然稳稳占据着业界头部的地位,并实现了持续增长。

硬件、模型和智能体,AWS正在驱动AI“大时代”

硬件、模型和智能体,AWS正在驱动AI“大时代”

另一方面,正如Matt Garman所说的那样,“在AWS,一切都要以客户为中心”。当各行各业的头部企业都依赖AWS来支撑他们的业务,而这些客户目前普遍在经历着AI时代的重塑时,帮助开发者适应这个新的时代,自然也就成为了AWS最为紧要的方向。

踩(0)

最新文章

相关文章

大家都在看