兩年前,大語言模型(LLM)的出現(xiàn),引發(fā)了全球科技從業(yè)者的普遍關(guān)注和行業(yè)熱潮。ChatGPT 月活用戶數(shù)以史上最快速度達(dá)到 1 億,AI 行業(yè)迎來“ChatGPT時刻”。經(jīng)過一段時間的狂奔,LLM性能階段性趨于飽和,大模型底層推動力逐漸收斂到少數(shù)擁有核心數(shù)據(jù)及算力資源的公司,行業(yè)注意力也更多轉(zhuǎn)到了以Agent為代表的行業(yè)應(yīng)用側(cè)。

如何解放 LLM 應(yīng)用的局限性。王維強調(diào),高質(zhì)量的行業(yè)數(shù)據(jù)和專業(yè)工具是 AI 繼續(xù)發(fā)展的關(guān)鍵壁壘和門檻,行業(yè)應(yīng)用需要系統(tǒng)性地解決專業(yè)嚴(yán)謹(jǐn)和安全可信等問題。螞蟻數(shù)科“蟻天鑒”產(chǎn)品,集大模型安全測評與防御為一體,讓大模型在生產(chǎn)和使用過程中更安全、可控、可靠。

他認(rèn)為,高質(zhì)量數(shù)據(jù)可以更好地模擬客觀世界,提升模型的準(zhǔn)確性和穩(wěn)定性。過去十年,伴隨著AI發(fā)展的范式轉(zhuǎn)移,對數(shù)據(jù)的要求也在持續(xù)改變。機器學(xué)習(xí)從“以模型為中心”轉(zhuǎn)向“以數(shù)據(jù)為中心”。在當(dāng)下的 LLM時代,行業(yè)應(yīng)用要做到安全可信,其核心是如何結(jié)合專業(yè)人工+AI算法的高效標(biāo)注,產(chǎn)生高質(zhì)量的標(biāo)注數(shù)據(jù)。

而面向未來的AGI時代,隨著互聯(lián)網(wǎng)公開數(shù)據(jù)逐步耗盡,以及GPT-o1帶來的強化學(xué)習(xí)訓(xùn)練新范式,都預(yù)示著數(shù)據(jù)合成的重要性進(jìn)一步提升。王維指出,如何通過仿真引擎、自博弈(self-play)強化學(xué)習(xí)的方式,合成出更多互聯(lián)網(wǎng)所不覆蓋的高質(zhì)量、高價值領(lǐng)域數(shù)據(jù),將是到達(dá)AGI時代的關(guān)鍵。

他也提醒道,AI 是把雙刃劍,AIGC濫用所帶來的風(fēng)險需要系統(tǒng)性應(yīng)對。不久前,“AI 教父” 杰弗里?辛頓(Geoffrey E. Hinton)在采訪中再次強調(diào)了其對AI安全問題的強烈擔(dān)憂。他與另外兩位圖靈獎得主約書亞?本吉奧(Yoshua Bengio)、姚期智及來自世界各地的幾十位科學(xué)家共同簽署了一封公開信——“AI 安全國際對話威尼斯共識”,呼吁為推動人工智能的發(fā)展制定更好的保障措施。

他們在公開信中警告道,“隨著人工智能的快速發(fā)展,這些‘災(zāi)難性的結(jié)果’隨時可能發(fā)生?!本科鋯栴}根源,在于 AIGC 的濫用不僅會產(chǎn)生虛假信息和網(wǎng)絡(luò)釣魚攻擊,還可能引發(fā)全球性的詐騙活動。其中,值得關(guān)注的一大風(fēng)險來源便是Deepfake, 即基于深度學(xué)習(xí)算法,從大量的視頻和圖像數(shù)據(jù)中學(xué)習(xí),偽造出逼真的面部動畫和語音。

王維介紹,螞蟻數(shù)科旗下身份安全品牌 ZOLOZ 為此專門研發(fā)了綜合防控產(chǎn)品 ZOLOZ Deeper,以應(yīng)對在開戶、登錄、支付等各種場景的深度偽造風(fēng)險。在服務(wù)印尼某頭部銀行后,產(chǎn)品上線一個月時間內(nèi)實現(xiàn)了 Deepfake 風(fēng)險“0 漏過”。

分享到

xiesc

相關(guān)推薦