大模型的“診療師”和“防護盾”,!“蟻天鑒”亮相國家網(wǎng)安周
2023-09-11 11:29:07? ?來源:東南網(wǎng) 責任編輯: 我來說兩句 |
11日,,2023國家網(wǎng)絡(luò)安全宣傳周在福州開幕。記者探營發(fā)現(xiàn),,螞蟻集團發(fā)布的大模型安全一體化解決方案“蟻天鑒”成為亮點,。該方案包含了大模型安全檢測平臺“蟻鑒2.0”,、大模型風險防御平臺“天鑒”兩大產(chǎn)品,目前這兩項產(chǎn)品已對外開放,。 生成式大模型安全檢測平臺“蟻鑒2.0” 在“百模大戰(zhàn)”的當下,,AIGC(生成式人工智能)的安全問題日益?zhèn)涫荜P(guān)注,。現(xiàn)場工作人員表示,大模型安全問題產(chǎn)生的本源主要為“用于訓(xùn)練的數(shù)據(jù)源頭有毒,、推理過程不可控,、外部惡意誘導(dǎo)”三個因素。此次發(fā)布的“蟻天鑒”,,主要從大模型安全性檢測度量,、智能風險防控、數(shù)據(jù)去毒對齊等方面,,來保障大模型在生產(chǎn)和使用過程中更加安全,、可控、可靠,。 “蟻鑒2.0”就像是大模型安全性的“診療師”,,在大模型上線前對其進行全方位的安全掃描,從數(shù)據(jù)安全,、內(nèi)容安全,、科技倫理等類型的數(shù)百種風險維度,提前識別和挖掘風險漏洞,。 現(xiàn)場工作人員介紹,,“蟻鑒2.0”是業(yè)內(nèi)首個產(chǎn)業(yè)級支持文本、圖像等全數(shù)據(jù)類型的AI安全檢測平臺,。它相當于站在“黑產(chǎn)”角度,,通過智能攻擊對抗技術(shù),自動生成數(shù)百萬的誘導(dǎo)性問題,,對生成式大模型進行誘導(dǎo)式問答,,并對大模型的回答實時、自動化的檢測計算,,24小時不眠不休“找茬”大模型存在的弱點和安全問題,。 “天鑒”則相當于在大模型外圍又加上了一個“防護盾”,通過智能化風控技術(shù),,幫助大模型擋住外界的惡意提問,,同時對生成的回答內(nèi)容進行風險過濾,保障大模型上線后從用戶輸入到生成輸出的整體安全防御,。 據(jù)介紹,,“天鑒”平臺集大數(shù)據(jù)底座、AI計算平臺,、智能運營,、應(yīng)用場景為一體,可實現(xiàn)低成本、規(guī)?;焖賾?yīng)用,,服務(wù)零售、金融,、直播,、游戲等提供生成式人工智能服務(wù)的業(yè)務(wù)場景。 此外,,針對數(shù)據(jù)源頭有毒,、深度黑盒不可控等問題,螞蟻集團結(jié)合“天鑒”平臺在大模型的訓(xùn)練和應(yīng)用過程中,,也在通過數(shù)據(jù)去毒,、對齊訓(xùn)練、可解釋研究等手段保障模型安全,。 本屆網(wǎng)絡(luò)安全博覽會上,,螞蟻集團還展示了可信AI決策大腦、隱私計算技術(shù)棧隱語,、螞蟻鏈摩斯多方安全計算平臺,、安全平行切面等網(wǎng)絡(luò)安全領(lǐng)域核心前沿技術(shù)的創(chuàng)新突破。 |
相關(guān)閱讀:
打印 | 收藏 | 發(fā)給好友 【字號 大 中 小】 |
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可(互聯(lián)網(wǎng)視聽節(jié)目服務(wù)/移動互聯(lián)網(wǎng)視聽節(jié)目服務(wù))證號:1310572 廣播電視節(jié)目制作經(jīng)營許可證(閩)字第085號
網(wǎng)絡(luò)出版服務(wù)許可證 (署)網(wǎng)出證(閩)字第018號 增值電信業(yè)務(wù)經(jīng)營許可證 閩B2-20100029 互聯(lián)網(wǎng)藥品信息服務(wù)(閩)-經(jīng)營性-2015-0001
福建日報報業(yè)集團擁有東南網(wǎng)采編人員所創(chuàng)作作品之版權(quán),,未經(jīng)報業(yè)集團書面授權(quán),不得轉(zhuǎn)載,、摘編或以其他方式使用和傳播
職業(yè)道德監(jiān)督,、違法和不良信息舉報電話:0591-87095403(工作日9:00-12:00、15:00-18:00) 舉報郵箱:[email protected] 福建省新聞道德委舉報電話:0591-87275327