為什么2025成了Agent落地元年?
時(shí)間:2025-07-20 02:53:19 出處:焦點(diǎn)閱讀(143)
題圖|視覺中國(guó)
如果有一個(gè)行業(yè),落地技術(shù)演進(jìn)如風(fēng)扇葉片轉(zhuǎn)動(dòng)之迅速;格局變化如走馬燈般眼花繚亂,元年那么非大模型莫屬。落地
回顧2023年,元年生成式AI的落地主題詞還是“百模大戰(zhàn)”,融資、元年刷榜成為這一時(shí)期的落地主流。
然而,元年隨著基座大模型的落地門檻不斷提升,短短一年時(shí)間,元年玩家格局就迅速收斂,落地到了2024年,元年市場(chǎng)已經(jīng)從百模齊發(fā)變?yōu)樯贁?shù)玩家的落地資本與技術(shù)持久戰(zhàn);
到了今年,行業(yè)關(guān)注重點(diǎn)再次從模型性能轉(zhuǎn)向落地價(jià)值,元年如何將大模型的落地能力轉(zhuǎn)化為業(yè)務(wù)的生產(chǎn)力,成為新的核心命題。
而Agent就是AWS給出的答案。
借助Agent,千行百業(yè)都有了將生意用大模型重做一遍的可能。
但如何低成本、高質(zhì)量的重新做一遍,如何讓Agent加速落地呢?
昨天凌晨舉辦的2024 年AWS紐約峰會(huì),給出了答案。
為什么是現(xiàn)在?為什么是Agent?
事實(shí)上,如果關(guān)注最近一段時(shí)間的大模型發(fā)布會(huì),可以發(fā)現(xiàn)一個(gè)很有趣的現(xiàn)象,無(wú)論是國(guó)內(nèi)的Kimi K2,還是海外的Grok 4,亦或是一個(gè)月之前的Minimax M2,在各種榜單SOTA(最佳表現(xiàn))之外,都不約而同的關(guān)注一個(gè)指標(biāo)——工具調(diào)用能力。甚至,就連OpenAI,也在今天凌晨推出了最新的ChatGPT Agent,主打多工具集成能力。
更直白來(lái)說(shuō),過去行業(yè)關(guān)心的是LLM本身,但今年,更加關(guān)注借助LLM能實(shí)現(xiàn)什么。
AWS峰會(huì)同樣如此。
不同于過去將最新的模型發(fā)布作為重磅亮點(diǎn),這一次的峰會(huì),Agentic AI 是唯一的關(guān)鍵詞。
一方面,它可以讓大模型從被動(dòng)響應(yīng)提示轉(zhuǎn)變?yōu)橥ㄟ^AI Agents主動(dòng)行動(dòng),來(lái)代表人類或系統(tǒng)進(jìn)行推理、規(guī)劃和完成具體任務(wù)。此外,相比傳統(tǒng)的workflow(工作流,其響應(yīng)機(jī)制被代碼寫死),Agents具有迭代思考的能力——可以評(píng)估結(jié)果、調(diào)整方法,并持續(xù)朝著既定目標(biāo)努力,具備更高的能力提升天花板。
比如,去年市場(chǎng)上一度流行一種AI教程,就是用大模型A,生成提示詞,大模型B根據(jù)提示詞配圖,然后將所有內(nèi)容一股腦丟給辦公軟件,借助辦公軟件的自動(dòng)排版功能進(jìn)行PPT美化。這個(gè)過程不僅繁瑣,并且十分低效。而通過AI智能助手,則能夠打通不同模型以及工具的內(nèi)部系統(tǒng)、利用語(yǔ)義數(shù)據(jù)源自動(dòng)提取上下文信息,直接根據(jù)用戶指令完成最終的交付結(jié)果。
那么為什么是今年?
這一波Agentic AI 爆火背后,有兩大原因:
其一是 CrewAI,LangGraph,LlamaIndex 在內(nèi),過去兩三年里各種Agent編排框架逐漸成熟,讓Agentic AI 構(gòu)建變得越來(lái)越容易。
其二則是標(biāo)準(zhǔn)化協(xié)議的出現(xiàn),例如模型上下文協(xié)議(MCP)和 Agent2Agent(A2A)極大簡(jiǎn)化了模型與工具之間的鏈接。也是自去年底MCP橫空出世起,從manus到genspark,從heygen到lovart,新的明星Agent玩家,如雨后春筍冒出,小團(tuán)隊(duì)、強(qiáng)業(yè)務(wù)創(chuàng)新、高實(shí)用性成為這一時(shí)期的創(chuàng)業(yè)團(tuán)隊(duì)主流畫像。
他們的出現(xiàn),進(jìn)一步帶動(dòng)了Agent在千行百業(yè)的落地。LangChain的(田野)調(diào)查結(jié)果則更為激進(jìn),超過一半的公司已經(jīng)在生產(chǎn)環(huán)境中部署Agent,近80%的正在研發(fā)Agent。
當(dāng)然,這中間存在的一個(gè)悖論——知道LangChain的企業(yè),大部分都是有Agent使用經(jīng)驗(yàn)或者意愿的玩家。
相對(duì)而言,Gartner的預(yù)測(cè)更加保守也更具普適性代表,到2028年,33%的企業(yè)軟件將使用Agentic AI,15%的日常工作決策將由Agent自主完成。
既然Agent未來(lái)將無(wú)處不在,那么如何快速找到、試用并部署Agent呢?
AWS在其Marketplace市場(chǎng)中目前已經(jīng)上架了上百種AI Agents & Tools,用戶只需用自然語(yǔ)言搜索,就能輕松找到所需要的Agent產(chǎn)品直接用于生產(chǎn)實(shí)踐。
不過,當(dāng)前情況來(lái)看,Agent的數(shù)量還遠(yuǎn)遠(yuǎn)不足以滿足千行百業(yè)的需求,而通用性Agent也并不足以直接解決行業(yè)與企業(yè)的獨(dú)特性問題。
在峰會(huì)現(xiàn)場(chǎng),AWS Agentic AI 副總裁 Swami 將這些尚未被解決的困難一共總結(jié)為六點(diǎn):
如何安全地執(zhí)行并擴(kuò)展Agent代碼,如何讓Agent能記住過往的互動(dòng)與學(xué)習(xí),如何讓Agent的身份和權(quán)限被進(jìn)一步細(xì)化,如何打造更適合復(fù)雜工作流的工具體系,如何發(fā)現(xiàn)和使用我們需要的工具與資源,如何讓Agent的每次交互都變得可被審核可追溯?
這些問題每一項(xiàng)都事關(guān)Agent能否從poc(概念試驗(yàn))真正走向生產(chǎn),也關(guān)系著Agent落地的體驗(yàn)與安全。
既然當(dāng)前仍然供需不匹配,那AWS干脆把構(gòu)建Agent的成本與門檻直接打下來(lái),讓更快速、靈活、大規(guī)模、更安全地去部署和構(gòu)建專屬Agent成為可能。
Amazon Bedrock AgentCore,如何降低構(gòu)建Agent的門檻?
Agent很好,但是哪怕只是半年前,構(gòu)建一個(gè)企業(yè)級(jí)Agent都依然是一個(gè)不小的難題。
原因很簡(jiǎn)單,不是所有公司都有manus與genspark這樣的能力,僅僅依靠模型+框架+MCP,就能把一個(gè)概念變成生產(chǎn)級(jí)Agent。
要知道,傳統(tǒng)的Agent開發(fā),除了需要了解Docker、K8s各種云原生生產(chǎn)環(huán)境,還需要能夠從上下文管理,到角色控制,到內(nèi)存系統(tǒng),再到內(nèi)容生成的可控性與安全合規(guī),每個(gè)環(huán)節(jié)都能做到極致。
而歷史經(jīng)驗(yàn)告訴我們:一個(gè)東西再好,如果它的門檻太高,產(chǎn)能始終受限,那就注定成為一個(gè)昂貴的玩具,而無(wú)法真正撬動(dòng)一個(gè)時(shí)代的創(chuàng)新。
因此,對(duì)于常規(guī)的有定制Agentic AI需求的客戶,AWS發(fā)布了一套完整的企業(yè)級(jí)服務(wù)解決方案——Amazon Bedrock AgentCore。
借助 Amazon Bedrock AgentCore,開發(fā)者能夠直接對(duì)接Amazon Bedrock 或第三方平臺(tái)部署的各類 AI 模型,并快速、安全的將 AI Agent從概念加速到生產(chǎn)環(huán)節(jié)。
為了彌合agent從poc(概念試驗(yàn))到production(生產(chǎn)環(huán)境)之間的溝鴻,AgentCore有以下七大模塊:
? AgentCore Runtime(運(yùn)行時(shí)環(huán)境):提供具備會(huì)話隔離機(jī)制的沙盒化低延遲無(wú)服務(wù)器環(huán)境,支持包括主流開源框架、工具和模型在內(nèi)的任意Agent架構(gòu),并能處理多模態(tài)工作負(fù)載及長(zhǎng)時(shí)運(yùn)行Agent。說(shuō)白了,借助AgentCore Runtime,開發(fā)者無(wú)需掌握Docker、K8s,就能直接上手agent部署。
? AgentCore Memory(記憶系統(tǒng)):可以通過統(tǒng)一管理會(huì)話記憶與長(zhǎng)期記憶,為模型提供關(guān)聯(lián)上下文,讓Agent持續(xù)學(xué)習(xí)用戶偏好等信息,變得更加智能與個(gè)性化。
? AgentCore Observability(可觀測(cè)性):Agent構(gòu)建難以一次到位已經(jīng)成為共識(shí),但如何發(fā)現(xiàn)問題,調(diào)整問題,就需要過程可視化追溯,AgentCore Observability正是為此而生,可支持元數(shù)據(jù)標(biāo)記、自定義評(píng)分、軌跡檢查及故障診斷/調(diào)試過濾器。
? AgentCore Identity(身份管理):支持AI Agents安全訪問AWS服務(wù)及GitHub、Salesforce、Slack等第三方工具,既可代表用戶操作,也可在獲得預(yù)先授權(quán)后自主執(zhí)行。
? AgentCore Gateway(網(wǎng)關(guān)服務(wù)):將現(xiàn)有API和Amazon Lambda函數(shù)轉(zhuǎn)化為Agent工具,提供跨協(xié)議統(tǒng)一訪問能力(含MCP協(xié)議),并支持運(yùn)行時(shí)自動(dòng)發(fā)現(xiàn)功能。
? AgentCore Browser(瀏覽器功能):這是今年以來(lái)Agent創(chuàng)業(yè)最火熱的方向,AgentCore Browser可以提供托管式瀏覽器實(shí)例,支持自動(dòng)化網(wǎng)頁(yè)操作流程擴(kuò)展,可以用于訪問沒有程序化API的系統(tǒng)或需要通過Web界面訪問的資源。
? AgentCore Code Interpreter(代碼解釋器):提供隔離式代碼執(zhí)行環(huán)境,保障生成代碼的安全運(yùn)行。
這些服務(wù)可以單獨(dú)使用,也可以協(xié)同工作,按需求按用量計(jì)費(fèi);此外,AgentCore還可以與任何AI代理框架與模型、協(xié)議(包括MCP和A2A)配合使用,真正幫助用戶實(shí)現(xiàn)適合的才是最好的。
此外,這些能力全都基于AWS成熟的安全基礎(chǔ)構(gòu)建,內(nèi)置身份控制和安全管控,讓Agent原生具備企業(yè)級(jí)安全與可靠性。
企業(yè)級(jí)Agent還缺什么,應(yīng)該長(zhǎng)什么樣子?
對(duì)于常規(guī)Agent需求,通過AgentCore中的工具組合,已經(jīng)可以解決80%以上的問題。但對(duì)于部分有著更高需求的企業(yè)級(jí)用戶而言,深度定制化才是大勢(shì)所趨。
針對(duì)這部分用戶,AWS推出了兩大亮點(diǎn)功能S3 Vectors、基于Amazon Nova模型的定制化功能,以及一個(gè)用于企業(yè)級(jí)AI coding的Agent范例Kiro。
當(dāng)下,Agent成為大模型落地的主流,而多數(shù)Agent的底層,本質(zhì)是一個(gè)由大模型驅(qū)動(dòng)的復(fù)雜RAG系統(tǒng)。
所謂RAG,即檢索增強(qiáng)生成,增強(qiáng)與生成部分依靠大模型,而檢索部分則依靠向量數(shù)據(jù)庫(kù)。
因此,活動(dòng)現(xiàn)場(chǎng)AWS還推出了Amazon S3 Vectors, 一種基于對(duì)象存儲(chǔ)的向量數(shù)據(jù)庫(kù)產(chǎn)品,可以提供亞秒級(jí)查詢性能,并將上傳、存儲(chǔ)和查詢向量的總成本降低高達(dá)90%,以應(yīng)對(duì)AI時(shí)代的海量非結(jié)構(gòu)化數(shù)據(jù)處理需求。
但一個(gè)問題是,在此之前AWS已經(jīng)推出了向量檢索產(chǎn)品OpenSearch,為什么還要額外推出Amazon S3 Vectors?
原因很簡(jiǎn)單,OpenSearch為代表傳統(tǒng)向量數(shù)據(jù)庫(kù),主要將向量加載在內(nèi)存之中,優(yōu)勢(shì)是高效、及時(shí)響應(yīng);但是內(nèi)存方案快速響應(yīng)的B面則是高成本。
向量數(shù)據(jù)對(duì)應(yīng)的元數(shù)據(jù)通常是非結(jié)構(gòu)化數(shù)據(jù),信息密度較低、體積較大,全部加載在內(nèi)存成本高昂,而S3這樣的對(duì)象存儲(chǔ),成本顯然更低,也更適合多數(shù)向量數(shù)據(jù)的檢索。
技術(shù)上,S3 Vectors 引入了向量桶概念,無(wú)需配置任何基礎(chǔ)設(shè)施,即可通過一組專用的 API 來(lái)存儲(chǔ)、訪問和查詢向量數(shù)據(jù)。在這個(gè)結(jié)構(gòu)中,每個(gè)向量桶都會(huì)對(duì)應(yīng)一組向量索引,用于高效的對(duì)數(shù)據(jù)進(jìn)行索引,每個(gè)向量桶最多可以包含10,000 個(gè)向量索引,每個(gè)向量索引可以包含數(shù)千萬(wàn)個(gè)向量。
此外,不同于市面上一些開源向量數(shù)據(jù)庫(kù)只是單純向量索引的集合,在S3 Vectors ,還支持將元數(shù)據(jù)與向量數(shù)據(jù)作為鍵值對(duì)的形式匹配,進(jìn)而支持向量+時(shí)間,向量+類別,向量+顏色,向量+價(jià)格等更高級(jí)的過濾檢索操作。
隨著時(shí)間的推移,當(dāng)用戶對(duì)向量進(jìn)行增刪改查,S3 Vectors會(huì)自動(dòng)優(yōu)化對(duì)應(yīng)的索引與數(shù)據(jù)分布,以實(shí)現(xiàn)向量存儲(chǔ)的最佳性價(jià)比。
而對(duì)于一些對(duì)高性能、實(shí)時(shí)響應(yīng)有更高要求的檢索增強(qiáng)生成(RAG)場(chǎng)景,S3 Vectors則可以與亞馬遜OpenSearch服務(wù)集成,將低頻的冷數(shù)據(jù)存儲(chǔ)在S3 Vectors,而將一些更高頻的熱數(shù)據(jù),移動(dòng)到OpenSearch,從而達(dá)成性能與成本的高效平衡。
基于高效的大模型與向量存儲(chǔ)系統(tǒng),Prompt優(yōu)化和 檢索增強(qiáng)生成(RAG)已經(jīng)可以很好地用于多數(shù)Agent的落地,但是仍有一些特殊業(yè)務(wù),仍需對(duì)模型層面進(jìn)行微調(diào)從而達(dá)成目標(biāo)。
一個(gè)常見的場(chǎng)景比如,企業(yè)需要基于RAG架構(gòu)構(gòu)建一個(gè)醫(yī)學(xué)或者法學(xué)Agent。但是在將非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)到向量數(shù)據(jù)庫(kù)之前,還需要經(jīng)過一個(gè)embedding環(huán)節(jié),把原始數(shù)據(jù)轉(zhuǎn)化為計(jì)算機(jī)可以理解的向量語(yǔ)言。
目前,市面上已經(jīng)有了很多成熟的embedding模型,但是具體到落地,我們依然要根據(jù)業(yè)務(wù)特性不同,對(duì)各種embedding模型進(jìn)行微調(diào),才能保證農(nóng)業(yè)中的蘋果與科技產(chǎn)業(yè)的蘋果被更好的區(qū)分,現(xiàn)實(shí)中的水桶與數(shù)據(jù)庫(kù)概念中的桶指向不同含義。
基于這一背景,AWS在Amazon SageMaker AI中推出了Amazon Nova定制化的功能,對(duì)模型進(jìn)行包括監(jiān)督微調(diào)(SFT)、直接偏好優(yōu)化(DPO)、近端策略優(yōu)化(PPO)、人類反饋強(qiáng)化學(xué)習(xí)(RLHF)、持續(xù)預(yù)訓(xùn)練(CPT)、知識(shí)蒸餾等在內(nèi)的操作。
目前,這些技術(shù)已經(jīng)可以作為現(xiàn)成的亞馬遜 SageMaker 組成使用,無(wú)縫部署到Amazon Bedrock,并支持按需和通過提供吞吐量推斷。據(jù)AWS官方數(shù)據(jù),目前已經(jīng)有超過10000名客戶使用Amazon Nova系列模型帶來(lái)顯著降本增效。
除了向量數(shù)據(jù)庫(kù)與模型微調(diào),最近大火的AI coding,AWS也沒有落下。
針對(duì)市面上常規(guī)的IDE產(chǎn)品只關(guān)注coding本身,而忽略了coding背后的產(chǎn)品需求、文檔、交互的問題,AWS推出了AI IDE產(chǎn)品Kiro,其關(guān)鍵創(chuàng)新有三:
? 規(guī)范驅(qū)動(dòng)開發(fā)(spec-driven development),可以幫助開發(fā)者通過自然語(yǔ)言和架構(gòu)圖清晰地表達(dá)他們對(duì)復(fù)雜功能的構(gòu)建邏輯。 ? 智能代理鉤子(Intelligent Agent hooks),可以自動(dòng)處理生成文檔、編寫測(cè)試和優(yōu)化性能等重要但耗時(shí)的任務(wù),在保存文件或提交代碼等情況下自動(dòng)觸發(fā)。 ? 專門設(shè)計(jì)的界面(purpose-built interface),支持聊天交互開發(fā),也支持規(guī)范驅(qū)動(dòng)開發(fā),適合的就是最好的。
而借助Kiro,專業(yè)開發(fā)者不僅能更高效的產(chǎn)出代碼,更能高效的產(chǎn)出高可用,更符合業(yè)務(wù)需求的代碼。
尾聲
回顧過去的歷史,當(dāng)下的AI浪潮已經(jīng)不是人類歷史上的第一次。而過去的多次AI泡沫已經(jīng)明明白白告訴我們,模型要落地才有價(jià)值。
這也是這一輪大模型浪潮與過去的最大不同之所在:
一方面模型本身具備極強(qiáng)的通用能力,構(gòu)建了其落地千行百業(yè)的地基;
在此基礎(chǔ)上,經(jīng)過AWS這樣的企業(yè)助推,框架、數(shù)據(jù)庫(kù)、調(diào)用接口、開發(fā)工具、模型微調(diào)工具依次成熟,讓Agent加速?gòu)母拍钭呦蚵涞兀踔脸蔀槊恳粋€(gè)行業(yè),每一個(gè)企業(yè)的專屬定制。
而這,也是技術(shù)泡沫與技術(shù)革命最大的區(qū)別之所在。
- end -
想把AI的想象力變成業(yè)務(wù)的增長(zhǎng)力?
2025亞馬遜云科技城市巡演,聚焦最熱門的 AI 場(chǎng)景,現(xiàn)場(chǎng)拆解、即時(shí)體驗(yàn),為城市伙伴帶來(lái)零距離的前沿洞察。七城席位同步開放,搜索“亞馬遜云科技”小程序,即刻注冊(cè)!
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表虎嗅立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系 [email protected]
本文來(lái)自虎嗅,原文鏈接:https://www.huxiu.com/article/4592549.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.
猜你喜歡
- 記者:如果萊比錫出售哈維
- 深圳新帥,曾是國(guó)足助教!首戰(zhàn)就遭遇執(zhí)教青島海牛的老搭檔李霄鵬
- 本周末,為什么沒“蘇超”?
- 亞冠燒腦劇:中國(guó)球迷在申花球迷區(qū)為日本隊(duì)加油 被日本球迷打了
- 青年追光者|“我今不言,你也即知我的工作” 揭秘抗日戰(zhàn)士家書中的“暗語(yǔ)”
- 北青:對(duì)比國(guó)足脆敗韓國(guó),國(guó)少隊(duì)有諸多可圈可點(diǎn)的地方
- 國(guó)足帶657件行李?官方辟謠僅140件,媒體人:菜是最大的原罪
- 長(zhǎng)沙伢子對(duì)決清華附中遺憾落敗,獲CHFL總決賽男子組亞軍!亞馬爾現(xiàn)場(chǎng)觀戰(zhàn)
- 皆大歡喜!TA:阿森納認(rèn)為馬杜埃凱交易非常劃算,切爾西也滿意