以上是F5最新給出的生成式AI時(shí)代的網(wǎng)絡(luò)架構(gòu),它從訪問網(wǎng)絡(luò)流量視角,給出了對(duì)AI應(yīng)用的透視。
該圖看上去復(fù)雜,但如果你熟悉現(xiàn)代化微服務(wù)應(yīng)用敏捷迭代的架構(gòu),就會(huì)發(fā)現(xiàn)二者差別主要是生成式AI,簡單說,生成式AI也會(huì)以API接口方式調(diào)用。
為什么會(huì)有這樣的判斷和結(jié)論呢?
從某種意義上來說,時(shí)代演進(jìn)就是網(wǎng)絡(luò)訪問流量模型的演進(jìn),互聯(lián)網(wǎng)是時(shí)代的基礎(chǔ),這個(gè)不會(huì)改變。
回首過往,大致可以分為互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)和生成式AI的時(shí)代,每個(gè)時(shí)代應(yīng)用的側(cè)重點(diǎn)不同。
在互聯(lián)網(wǎng)時(shí)代,重點(diǎn)關(guān)注的是訪問流量負(fù)載均衡,用于應(yīng)對(duì)海量互聯(lián)網(wǎng)訪問接入,確保訪問接入響應(yīng)及時(shí)性,以系統(tǒng)穩(wěn)定性為主要訴求;進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代,容器/微服務(wù)化為特征的云原生應(yīng)用盛行,很多大型企業(yè)級(jí)用戶需要同時(shí)應(yīng)對(duì)傳統(tǒng)應(yīng)用上云以及部分云原生應(yīng)用,需要在混合云、多云業(yè)務(wù)環(huán)境下,協(xié)調(diào)負(fù)載均衡在內(nèi)的應(yīng)用交付(ADC),提供SaaS服務(wù)解決了傳統(tǒng)用戶的難題。
如今生成式AI的時(shí)代,AI技術(shù)將被廣泛期待,也對(duì)ADC提出了新挑戰(zhàn),不論是訓(xùn)練還是推理,都需要高水平ADC服務(wù),以提升效率,確保GPU等計(jì)算資源的充分利用,與此同時(shí),也需要ADC為AI 推理提供安全和管理,確保業(yè)務(wù)的穩(wěn)定運(yùn)行。
按照F5的判斷,企業(yè)級(jí)用戶AI技術(shù)應(yīng)用不只一個(gè)大模型,而是多種模型協(xié)調(diào)工作,很多企業(yè)級(jí)用戶都在使用自己的數(shù)據(jù)來設(shè)計(jì)檢索增強(qiáng)生成(RAG)系統(tǒng),增強(qiáng)AI模型的推理結(jié)果,API接口將是AI推理主要的連接方式。
非業(yè)務(wù)功能模塊重于泰山
如果AI應(yīng)用呈現(xiàn)API接口調(diào)用的局面,那么如何確保這些API接口的安全可靠將至關(guān)重要?
OWASP(Open Web Application Security Project,開放 Web 應(yīng)用安全項(xiàng)目),一個(gè)致力于提高軟件應(yīng)用的安全性的全球性開放非營利性組織,特別列舉了AI API訪問的10大關(guān)鍵,涉及身份認(rèn)證、授權(quán)、資源消耗等控制內(nèi)容。
如果這些問題不能夠得到有效解決,將會(huì)給企業(yè)的AI推理帶來災(zāi)難性的后果,例如2022年,加拿大航空的聊天機(jī)器人向乘客承諾了一個(gè)原本不存在的折扣,最后導(dǎo)致被索賠;一家新聞網(wǎng)站盲目使用AI撰寫文章,造成了新聞災(zāi)難……
F5亞太區(qū)首席技術(shù)官M(fèi)ohan Veloo指出:這些都是APP過渡依賴LLMs大語言模型的結(jié)果,從而忽略了大模型“幻覺(Hallucinations)”,實(shí)質(zhì)問題還是對(duì)于AI LLM風(fēng)險(xiǎn)缺乏掌控。
大模型廠商不能解決這些問題嗎?
“他們關(guān)注的是大模型的智能水平,連接管理、LLM安全等非業(yè)務(wù)功能模塊不是其關(guān)注重點(diǎn),這就是術(shù)業(yè)有專攻。從AI應(yīng)用的角度來說,這些非業(yè)務(wù)功能模塊的重要性甚至超越業(yè)務(wù)模塊本身,這也是ADC需要承擔(dān)的責(zé)任?!?Mohan Veloo說。
ADC發(fā)展與時(shí)俱進(jìn)
為滿足生成式AI時(shí)代企業(yè)級(jí)AI管控的需要,以“AI for ADC,ADC for AI”為主題,F(xiàn)5面向AI應(yīng)用推出了包括AI網(wǎng)關(guān)、K8S入口控制在內(nèi)的6大ADC方案。
無論是AI訓(xùn)練還是推理,新的解決方案都會(huì)帶來完全不同的價(jià)值和應(yīng)用體驗(yàn)。
以面向BIG-IP負(fù)載均衡設(shè)備的iRule為例,它是 F5提出的一種采用專用腳本語言編寫的自定義規(guī)則,用于對(duì)網(wǎng)絡(luò)訪問流量進(jìn)行實(shí)時(shí)動(dòng)態(tài)地控制和處理。例如,大型電商網(wǎng)站使用 iRule 應(yīng)對(duì)突發(fā)的訪問高峰,按照地區(qū)、用戶類型將流量導(dǎo)向指定的服務(wù)器集群,優(yōu)化資源利用和提高用戶體驗(yàn)。
針對(duì)不同類型的訪問攻擊提供有針對(duì)性的措施。以DDoS為例,有些攻擊是通過海量并發(fā)訪問實(shí)施攻擊,也有些攻擊其并發(fā)量并不大,但是每個(gè)訪問會(huì)消耗大量資源,同樣達(dá)到DDoS的效果。
iRule在使用中需要預(yù)先開發(fā)很多功能模板,對(duì)技術(shù)人員的能力以及響應(yīng)水平有很高要求。如今,借助生成式AI技術(shù)加持,憑借自然語言,通過AI就可以實(shí)現(xiàn)iRule代碼生成,面貌為之一新,使用門檻大大降低。
針對(duì)企業(yè)級(jí)AI推理的應(yīng)用,F(xiàn)5通過AI 網(wǎng)關(guān)產(chǎn)品來化解LLMs大模型的風(fēng)險(xiǎn)。
作為用戶與LLMs大模型之間的代理,AI 網(wǎng)關(guān)檢查生成式AI會(huì)話,采用細(xì)粒度的訪問控制、合規(guī)策略來確保生成結(jié)果的安全性、合規(guī)性。它采用高度可擴(kuò)展的設(shè)計(jì),易于與客戶現(xiàn)有的F5數(shù)據(jù)管理集成,加速大規(guī)模AI體驗(yàn)部署,降低成本。
據(jù)了解,AI網(wǎng)關(guān)通過自動(dòng)檢測、修復(fù)提供安全和合規(guī)性等策略實(shí)施,應(yīng)對(duì)OWASP 強(qiáng)調(diào)的LLM 10大安全風(fēng)險(xiǎn);利用語義緩存卸載LLM中的重復(fù)任務(wù),優(yōu)化本地和第三方LLM的負(fù)載平衡、流量路由和速率限制,保持服務(wù)可用性的同時(shí)提升性能。
針對(duì)中國企業(yè)出海所面臨的PCIDSS(Payment Card Industry Data Security Standard,支付卡行業(yè)數(shù)據(jù)安全標(biāo)準(zhǔn))、HIPAA(Health Insurance Portability and Accountability Act,健康保險(xiǎn)流通與責(zé)任法案)以及GDPR (General Data Protection Regulation,通用數(shù)據(jù)保護(hù)條例)等安全與隱私法規(guī)遵從的需要,F(xiàn)5 XC分布式云服務(wù)平臺(tái)提供了從公有云、邊緣到私有云AI應(yīng)用部署和管理,為出海企業(yè)提供高效、安全和可擴(kuò)展性ADC服務(wù)。
Mohan Veloo表示:“F5 的使命是在任何地方防護(hù)、交付并優(yōu)化任何應(yīng)用及 API。在AI時(shí)代,F(xiàn)5始終致力于通過創(chuàng)新的應(yīng)用交付和應(yīng)用安全解決方案,助力企業(yè)應(yīng)對(duì)AI技術(shù)帶來的全新挑戰(zhàn)與機(jī)遇。面對(duì)AI應(yīng)用產(chǎn)生的海量數(shù)據(jù)負(fù)載,推理與訓(xùn)練節(jié)點(diǎn)必須依賴可靠且高帶寬的連接,而AI集群的高效運(yùn)行則離不開強(qiáng)大的調(diào)度工具,以確保GPU資源的充分利用并靈活應(yīng)對(duì)可能的故障。F5精準(zhǔn)聚焦這些關(guān)鍵環(huán)節(jié),為企業(yè)提供全面支持,將助力企業(yè)有效解決AI復(fù)雜性問題,推動(dòng)AI技術(shù)的更廣泛落地?!?。
全力拓展三大新興行業(yè)
F5亞太區(qū)副總裁、北亞區(qū)總裁黃彥文透露:從全球到中國,F(xiàn)5一直致力于將最領(lǐng)先的科技帶給用戶,幫助用戶在數(shù)字時(shí)代把握先機(jī)。
F5將繼續(xù)深耕中國市場,并為此制定了三大策略:
完善AI產(chǎn)品組合:聚焦AI訓(xùn)練和推理場景,持續(xù)優(yōu)化多云環(huán)境中的應(yīng)用交付和應(yīng)用安全解決方案,構(gòu)建更高效、更智能的AI支持體系。
全面縱深新行業(yè):深入拓展汽車、生物制藥、高端制造(集成電路)行業(yè),同時(shí)挖掘新能源、新零售等新行業(yè)領(lǐng)域潛力,以定制化解決方案幫助企業(yè)實(shí)現(xiàn)數(shù)字化和智能化轉(zhuǎn)型。
共創(chuàng)渠道伙伴生態(tài):加強(qiáng)與技術(shù)合作伙伴和渠道伙伴的聯(lián)動(dòng),推動(dòng)生態(tài)協(xié)作,共同開發(fā)面向未來的創(chuàng)新方案,打造更具韌性和競爭力的行業(yè)生態(tài)體系。
據(jù)透露:目前F5攜手NVIDIA聯(lián)合發(fā)布了AI解決方案,通過搭載NVIDIA BlueField-3 DPU,將面向AI應(yīng)用ADC能力提升一個(gè)新的臺(tái)階;F5與英特爾合作,將F5 NGINX Plus與英特爾OpenVINO 工具套件及基礎(chǔ)設(shè)施處理單元(IPUs)發(fā)行版進(jìn)行組合,為AI應(yīng)用提供尖端性能優(yōu)化的能力;此外,F(xiàn)5與Red Hat、戴爾、NetApp等多家全球領(lǐng)先的技術(shù)廠商建立戰(zhàn)略聯(lián)盟,共同推動(dòng)AI應(yīng)用交付與應(yīng)用安全領(lǐng)域的創(chuàng)新。
黃彥文表示:“2025年,F(xiàn)5將以‘AI for ADC, ADC for AI’為創(chuàng)新動(dòng)力,持續(xù)推出基于AI技術(shù)的領(lǐng)先產(chǎn)品與解決方案,為應(yīng)用交付的優(yōu)化與安全保駕護(hù)航。同時(shí),我們將積極拓展創(chuàng)新優(yōu)勢至更多行業(yè)場景,與合作伙伴共同推動(dòng)行業(yè)數(shù)字化轉(zhuǎn)型,攜手打造更好的數(shù)字世界?!?/p>
小結(jié)
一千個(gè)讀者就有一千個(gè)哈姆雷特,對(duì)于企業(yè)級(jí)生成式AI應(yīng)用也是如此。
可以肯定的是,大多數(shù)的企業(yè)不會(huì)訓(xùn)練通用大模型,更多的是要將大模型和企業(yè)私有數(shù)據(jù)進(jìn)行結(jié)合,大模型服務(wù)更多會(huì)以API接口調(diào)用的方式呈現(xiàn),加強(qiáng)對(duì)于網(wǎng)絡(luò)訪問入口流量的掌控,無疑就抓住了商業(yè)應(yīng)用的關(guān)鍵。
生成式AI不是用來頂禮膜拜的,需要助力企業(yè)應(yīng)用才能夠創(chuàng)造商業(yè)價(jià)值,商業(yè)離不開成熟的管理軟件保駕護(hù)航!