F5攜手英偉達全面增強AI時代的性能、多租戶與安全能力
時間:2025-07-12 08:31:55 出處:綜合閱讀(143)
【TechWeb】7月9日消息,手英時代全球應用交付和API安全解決方案提供商F5宣布F5 BIG-IP Next for Kubernetes推出全新功能,偉達該解決方案深度整合NVIDIA BlueField-3 DPU以及NVIDIA DOCA軟件框架,全面并已通過歐洲客戶Sesterce的增強租戶實際部署驗證。
作為對F5應用交付與安全平臺(F5 Application Delivery and 多能力Security Platform)的進一步擴展,BIG-IP Next for Kubernetes現可原生運行于NVIDIA BlueField-3 DPU,安全為大規模AI基礎設施提供高性能流量管理與安全防護,手英時代從而顯著提升AI應用的偉達運行效率、控制能力與性能表現。全面
借助該聯合解決方案,增強租戶企業可將簡單的多能力AI相關任務路由至成本更低、更輕量級的安全LLM以支持生成式AI,同時將更復雜的手英時代查詢留給性能更強大的高階模型處理。該可定制化的偉達智能路由機制還支持按領域調用特定 LLM,從而提升輸出質量并顯著改善客戶體驗。全面F5的先進流量管理技術可確保查詢精準分發至最適合的模型節點,從而降低延遲并加快首個詞元生成時間。
今年早些時候,NVIDIA推出Dynamo框架,旨在為生成式AI與推理模型在大規模分布式環境中的部署提供支撐。通過統一調度、流量路由和內存管理等核心任務,NVIDIA Dynamo有效簡化了分布式環境中AI推理的復雜性,確保其在動態工作負載下的穩定運行。F5與NVIDIA的聯合解決方案的核心優勢之一,是將部分計算操作從CPU卸載至BlueField DPU,從而顯著提升整體效率。借助F5技術,Dynamo KV Cache Manager可基于容量智能路由請求,并通過鍵值(KV)緩存機制,顯著加速生成式AI應用的響應速度。該機制通過復用歷史運算信息,避免重復計算,顯著降低資源開銷。就基礎架構而言,企業通過KV緩存存儲與復用機制,相比直接占用GPU昂貴的內存資源,能以更低成本實現性能優化。
另外,通過在MCP服務器前端部署F5與NVIDIA聯合解決方案,F5可充當反向代理,從而增強MCP解決方案及其所支持LLM的安全能力。同時,F5 iRules提供的全數據可編程能力,能夠快速并靈活地響應AI協議的快速演進需求,并進一步抵御新興網絡安全風險。
新浪科技公眾號“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)
相關新聞上一篇:被追一球!阿連德后場丟球,卡爾
下一篇:最近,申花在忙這些事