F5攜手NVIDIA全面增強(qiáng)AI時(shí)代的性能、多租戶與安全能力
時(shí)間:2025-07-12 11:54:35 出處:百科閱讀(143)
巴黎,攜性2025年7月9日?–?全球領(lǐng)先的全強(qiáng)A全應(yīng)用交付和API安全解決方案提供商F5(NASDAQ:FFIV),日前宣布F5 BIG-IP Next for Kubernetes推出全新功能。面增該解決方案深度整合NVIDIA BlueField-3 DPU以及NVIDIA DOCA軟件框架,代的多租并已通過(guò)歐洲客戶Sesterce的戶安實(shí)際部署驗(yàn)證。Sesterce是攜性歐洲領(lǐng)先的新一代基礎(chǔ)設(shè)施及主權(quán)人工智能(AI)運(yùn)營(yíng)商,致力于滿足加速計(jì)算與AI發(fā)展的全強(qiáng)A全嚴(yán)苛需求。?
作為對(duì)F5應(yīng)用交付與安全平臺(tái)(F5 Application Delivery and 面增Security Platform)的進(jìn)一步擴(kuò)展,BIG-IP Next for Kubernetes現(xiàn)可原生運(yùn)行于NVIDIA BlueField-3 DPU,代的多租為大規(guī)模AI基礎(chǔ)設(shè)施提供高性能流量管理與安全防護(hù),戶安從而顯著提升AI應(yīng)用的攜性運(yùn)行效率、控制能力與性能表現(xiàn)。全強(qiáng)A全今年早些時(shí)候,面增F5 曾在該解決方案正式發(fā)布時(shí)公開(kāi)普遍可用性并展示其卓越性能優(yōu)勢(shì)。代的多租如今,戶安Sesterce已完成對(duì)該聯(lián)合解決方案多項(xiàng)關(guān)鍵能力的驗(yàn)證,涵蓋以下領(lǐng)域:
Sesterce首席執(zhí)行官兼聯(lián)合創(chuàng)始人Youssef El Manssouri表示,“早在尚未進(jìn)行任何測(cè)試前,F(xiàn)5與NVIDIA的集成方案就展現(xiàn)出令人矚目的潛力。通過(guò)在AI環(huán)境中實(shí)現(xiàn)高吞吐量的Kubernetes入口與出口流量,我們的測(cè)試結(jié)果印證了F5動(dòng)態(tài)負(fù)載均衡技術(shù)的卓越優(yōu)勢(shì)。該解決方案不僅提升了流量分發(fā)效率,優(yōu)化了GPU資源利用率,同時(shí)也使我們能夠?yàn)榭蛻籼峁└嗖町惢瘍r(jià)值。我們很高興地看到F5正不斷拓展對(duì)NVIDIA多樣化應(yīng)用場(chǎng)景的支持,包括增強(qiáng)型多租戶功能。我們期待雙方在下一代AI基礎(chǔ)設(shè)施領(lǐng)域持續(xù)深化合作,推動(dòng)更多技術(shù)創(chuàng)新。”
全新解決方案的核心能力價(jià)值包括:
借助該聯(lián)合解決方案,企業(yè)可將簡(jiǎn)單的AI相關(guān)任務(wù)路由至成本更低、更輕量級(jí)的LLM以支持生成式AI,同時(shí)將更復(fù)雜的查詢留給性能更強(qiáng)大的高階模型處理。該可定制化的智能路由機(jī)制還支持按領(lǐng)域調(diào)用特定 LLM,從而提升輸出質(zhì)量并顯著改善客戶體驗(yàn)。F5的先進(jìn)流量管理技術(shù)可確保查詢精準(zhǔn)分發(fā)至最適合的模型節(jié)點(diǎn),從而降低延遲并加快首個(gè)詞元生成時(shí)間。
F5首席創(chuàng)新官Kunal Anand表示,“當(dāng)前,企業(yè)日益采用多模型架構(gòu)以打造先進(jìn)的AI體驗(yàn),但LLM 流量智能分類與路由計(jì)算資源消耗大,易導(dǎo)致系統(tǒng)性能下降并影響用戶體驗(yàn)。F5 BIG-IP Next for Kubernetes通過(guò)在NVIDIA BlueField-3 DPU上直接編寫(xiě)路由邏輯,提供了業(yè)界當(dāng)前最高效的LLM流量交付與安全解決方案。這僅僅是一個(gè)開(kāi)始——我們的平臺(tái)正在為AI基礎(chǔ)設(shè)施釋放更多潛能。隨著企業(yè)級(jí)AI規(guī)模持續(xù)擴(kuò)大,我們期待未來(lái)持續(xù)深化與NVIDIA的聯(lián)合創(chuàng)新。”
今年早些時(shí)候,NVIDIA推出Dynamo框架,旨在為生成式AI與推理模型在大規(guī)模分布式環(huán)境中的部署提供支撐。通過(guò)統(tǒng)一調(diào)度、流量路由和內(nèi)存管理等核心任務(wù),NVIDIA Dynamo有效簡(jiǎn)化了分布式環(huán)境中AI推理的復(fù)雜性,確保其在動(dòng)態(tài)工作負(fù)載下的穩(wěn)定運(yùn)行。F5與NVIDIA的聯(lián)合解決方案的核心優(yōu)勢(shì)之一,是將部分計(jì)算操作從CPU卸載至BlueField DPU,從而顯著提升整體效率。借助F5技術(shù),Dynamo KV?Cache Manager可基于容量智能路由請(qǐng)求,并通過(guò)鍵值(KV)緩存機(jī)制,顯著加速生成式AI應(yīng)用的響應(yīng)速度。該機(jī)制通過(guò)復(fù)用歷史運(yùn)算信息,避免重復(fù)計(jì)算,顯著降低資源開(kāi)銷。就基礎(chǔ)架構(gòu)而言,企業(yè)通過(guò)KV緩存存儲(chǔ)與復(fù)用機(jī)制,相比直接占用GPU昂貴的內(nèi)存資源,能以更低成本實(shí)現(xiàn)性能優(yōu)化。?
NVIDIA AI網(wǎng)絡(luò)與安全解決方案生態(tài)系統(tǒng)及市場(chǎng)營(yíng)銷高級(jí)總監(jiān)Ash Bhalgat表示,“采用NVIDIA BlueField-3 DPU加速的BIG-IP Next for Kubernetes,為企業(yè)與服務(wù)提供商提供了單點(diǎn)控制,助力AI工廠實(shí)現(xiàn)高效GPU利用率,并加速數(shù)據(jù)攝取、模型訓(xùn)練、推理、檢索增強(qiáng)生成(RAG)及代理式AI等各類 AI 流量處理。此外,F(xiàn)5對(duì)多租戶的支持以及iRules可編程性方面的持續(xù)優(yōu)化,為未來(lái)進(jìn)一步集成NVIDIA Dynamo分布式KV Cache Manager等先進(jìn)特性打下了堅(jiān)實(shí)基礎(chǔ)。”
MCP是由Anthropic推出的一項(xiàng)開(kāi)放協(xié)議,旨在標(biāo)準(zhǔn)化應(yīng)用向LLM提供上下文信息的方式。通過(guò)在MCP服務(wù)器前端部署F5與NVIDIA聯(lián)合解決方案,F(xiàn)5可充當(dāng)反向代理,從而增強(qiáng)MCP解決方案及其所支持LLM的安全能力。同時(shí),F(xiàn)5 iRules提供的全數(shù)據(jù)可編程能力,能夠快速并靈活地響應(yīng)AI協(xié)議的快速演進(jìn)需求,并進(jìn)一步抵御新興網(wǎng)絡(luò)安全風(fēng)險(xiǎn)。?
World Wide Technology全球服務(wù)提供商高級(jí)副總裁Greg Schoeny表示,“實(shí)施代理式AI的企業(yè)日益依賴MCP部署來(lái)提升LLM的安全性與性能。F5與NVIDIA通過(guò)為大規(guī)模Kubernetes環(huán)境提供先進(jìn)的流量管理與安全防護(hù)能力,打造了融合可編程性與自動(dòng)化能力的AI 功能集,這一集成解決方案目前在業(yè)界尚無(wú)先例。”
基于NVIDIA BlueField-3 DPU平臺(tái)部署的F5 BIG-IP Next for Kubernetes現(xiàn)已全面上市。
AINVIDIA流量DPUNext 新浪科技公眾號(hào)“掌”握科技鮮聞 (微信搜索techsina或掃描左側(cè)二維碼關(guān)注)
相關(guān)新聞猜你喜歡
- 羅馬諾:羅馬約2000萬(wàn)歐報(bào)價(jià)韋斯利,但弗拉門(mén)戈堅(jiān)持要2500萬(wàn)歐
- 世俱杯高手在這里!船長(zhǎng)12連紅&香哥、膽定哥10連紅
- 中國(guó)排名:殷若寧維持第四位 許贏周詩(shī)媛排名上升
- 老人多期票擒大樂(lè)透1465萬(wàn) 偏愛(ài)守號(hào)一年一換
- 津門(mén)虎三將現(xiàn)身天津青少年足球精英訓(xùn)練營(yíng),與小球員深度互動(dòng)
- [新浪彩票]足彩第25093期任九:切爾西坐和望贏
- 爆25億彩票巨獎(jiǎng)?wù)Q生 “匿名兌獎(jiǎng)”新規(guī)生效引熱議
- 蘇超“南哥”全勝背后的縮影 校園足球成范本
- 徐繼祖領(lǐng)取中甲第14輪最佳球員獎(jiǎng)杯:榮幸,感謝最好的團(tuán)隊(duì)