中新經(jīng)緯2月18日電 (孫慶陽)“人工智能的安全與可用性面臨全鏈條、多維度交織的復(fù)雜風(fēng)險挑戰(zhàn),需通過國際合作、技術(shù)創(chuàng)新和標(biāo)準(zhǔn)制定來應(yīng)對!苯,中國信息通信研究院人工智能研究所高級業(yè)務(wù)主管呼娜英在巴黎人工智能(AI)行動峰會后接受中新經(jīng)緯專訪時表示,未來五到十年,人工智能技術(shù)將持續(xù)深化,增強(qiáng)語言大模型能力是重點方向。同時,多模態(tài)模型有望加速突破,提升圖文理解和跨模態(tài)交互能力。
呼娜英 受訪者供圖
網(wǎng)絡(luò)和框架是AI系統(tǒng)安全的根基
在最近的巴黎人工智能(AI)行動峰會上,AI安全性和可用性成為了全球AI產(chǎn)業(yè)人士的共同關(guān)注焦點。呼娜英指出,當(dāng)前AI在安全性和可用性方面面臨的是全鏈條、多維度相互交織的復(fù)雜風(fēng)險挑戰(zhàn)。隨著人工智能模型復(fù)雜度和規(guī)模的不斷提升,其訓(xùn)練、部署、應(yīng)用等關(guān)鍵環(huán)節(jié)中面臨的數(shù)據(jù)安全、網(wǎng)絡(luò)安全、框架安全、模型算法安全以及應(yīng)用平臺安全問題日益突出。
在基礎(chǔ)設(shè)施方面,網(wǎng)絡(luò)安全和框架安全關(guān)乎整個AI系統(tǒng)的穩(wěn)定運(yùn)行根基。以DeepSeek為例,R1模型在剛剛上線提供服務(wù)后,便遭到大規(guī)模DDoS(分布式阻斷服務(wù))攻擊,導(dǎo)致服務(wù)中斷,用戶無法正常訪問。在數(shù)據(jù)方面,訓(xùn)練數(shù)據(jù)被“投毒”(通過惡意注入虛假或誤導(dǎo)性的數(shù)據(jù)來污染模型的訓(xùn)練數(shù)據(jù)集),以及訓(xùn)練使用敏感行業(yè)數(shù)據(jù)、個人隱私數(shù)據(jù)等,一旦數(shù)據(jù)被“投毒”,訓(xùn)練出的模型將產(chǎn)生偏差,做出錯誤決策,而敏感數(shù)據(jù)的不當(dāng)使用則可能引發(fā)嚴(yán)重的法律風(fēng)險和社會信任危機(jī)。
在模型算法層面,以大模型為代表的生成式模型面臨嚴(yán)峻的越獄攻擊、提示詞注入攻擊等威脅,模型容易在用戶惡意操作下輸出違法有害或侵害權(quán)益的信息。
此外,模型的“幻覺”(模型生成的不真實、編造或與上下文不一致的內(nèi)容)問題突出,也成為了制約人工智能產(chǎn)業(yè)化落地的重要因素。在應(yīng)用層面,人工智能技術(shù)容易被濫用和誤用,比如利用圖像生成技術(shù)偽造虛假新聞圖片誤導(dǎo)公眾,或在自動化決策系統(tǒng)中因算法偏見導(dǎo)致對特定群體的不公平對待,這些行為嚴(yán)重擾亂了正常的社會秩序與市場環(huán)境。
如何顯著提升AI系統(tǒng)安全性?
呼娜英強(qiáng)調(diào),全球均在探索風(fēng)險管理的可行路徑,針對人工智能風(fēng)險開展有效的“識別、評估、應(yīng)對”方案一定程度上成為共識。其中,最重要的一環(huán)是對于安全問題的檢測技術(shù)和防護(hù)手段。在檢測方面,一是形成對于開源框架、源代碼以及網(wǎng)絡(luò)等軟硬件基礎(chǔ)設(shè)施的漏洞挖掘技術(shù),精準(zhǔn)定位潛在隱患。特別是開源框架、代碼中存在的未被發(fā)現(xiàn)的漏洞,極易被利用實施大規(guī)模的攻擊和勒索。如去年年初,人工智能開源框架Ray被發(fā)現(xiàn)存在漏洞,并被攻擊人員利用攻擊數(shù)百個集群。
二是形成數(shù)據(jù)“投毒”檢測技術(shù),用于守護(hù)訓(xùn)練數(shù)據(jù)的純凈性,防范通過訓(xùn)練的方式,在模型中埋入后門。
三是建立大模型等模型算法漏洞自動化測試技術(shù),掃描算法中的薄弱環(huán)節(jié),快速生成測試報告。
四是基于現(xiàn)有的自動化滲透技術(shù)能力,形成面向人臉識別、智能體等人工智能典型應(yīng)用的自動化滲透技術(shù)產(chǎn)品,模擬黑客攻擊,全方位探測應(yīng)用平臺的安全漏洞,充分發(fā)掘人工智能各方面的安全風(fēng)險。
呼娜英還指出,在防護(hù)層面,需要探索軟硬件基礎(chǔ)設(shè)施的漏洞自動化修復(fù)技術(shù),自動修復(fù)受損代碼,降低安全風(fēng)險。此外,還可以探索實踐模型漏洞自動化微調(diào)和加固技術(shù),對模型進(jìn)行自動化優(yōu)化,增強(qiáng)其抵御攻擊的能力,保障人工智能系統(tǒng)穩(wěn)定、安全地運(yùn)行。
中國智慧引領(lǐng)未來AI治理新格局
呼娜英認(rèn)為,推動人工智能安全治理合作依然是勢不可擋的,也是確有必要的。人工智能的開發(fā)、部署和使用具有全球化特征,人工智能技術(shù)的應(yīng)用與影響并非局限于某一地區(qū)或國家,而是深刻影響全球社會、經(jīng)濟(jì)和政治秩序。為人類共同未來建立務(wù)實可行的國際對話與合作機(jī)制,需要多方努力。未來,國際社會應(yīng)在聯(lián)合國框架下凝聚各方共識,依托國際標(biāo)準(zhǔn)化組織深化技術(shù)標(biāo)準(zhǔn)協(xié)同,務(wù)實推進(jìn)人工智能安全治理工作。
一直以來,中國在全球人工智能治理領(lǐng)域積極作為并推動加強(qiáng)國際合作。例如,中國信通院積極參與國際標(biāo)準(zhǔn)制定,發(fā)起《人工智能安全承諾》促進(jìn)行業(yè)自律,下一步將依托工業(yè)和信息化部人工智能技術(shù)標(biāo)準(zhǔn)委員會,持續(xù)完善國內(nèi)標(biāo)準(zhǔn)體系,推動安全測試、風(fēng)險評估、可信要求等技術(shù)規(guī)范轉(zhuǎn)化為國際共識,促進(jìn)技術(shù)標(biāo)準(zhǔn)和指引的深入實踐與應(yīng)用。
呼娜英預(yù)測,未來五到十年內(nèi),人工智能技術(shù)將持續(xù)深化演進(jìn)。一方面,增強(qiáng)語言大模型能力仍是技術(shù)升級的重點方向之一,推理或?qū)@得更多關(guān)注和資源投入。另一方面,多模態(tài)模型有望加速突破,從以語言大模型為骨干的多模態(tài)模型,向原生多模態(tài)模型演變,提升圖文理解和跨模態(tài)交互能力。
呼娜英認(rèn)為,在安全與可用性方面,以下趨勢值得關(guān)注:在風(fēng)險識別方面,隨著人工智能技術(shù)日益融入經(jīng)濟(jì)社會發(fā)展各領(lǐng)域全過程,其安全風(fēng)險面不斷擴(kuò)大,對人工智能安全風(fēng)險識別方法論的研究將不斷完善,從而催生更加敏捷、精準(zhǔn)的安全風(fēng)險識別機(jī)制。在風(fēng)險應(yīng)對方面,對算法模型毒性、魯棒性、公平性等方面的評測技術(shù)工具研究將不斷加強(qiáng),將人工智能基礎(chǔ)設(shè)施、算法模型、上層應(yīng)用以及產(chǎn)業(yè)鏈等方面作為評估重點,并在機(jī)制方案上動態(tài)迭代、技術(shù)能力上持續(xù)提升,從而有效防范和應(yīng)對治理風(fēng)險。(中新經(jīng)緯APP)
中新經(jīng)緯版權(quán)所有,未經(jīng)授權(quán),不得轉(zhuǎn)載或以其他方式使用。
責(zé)任編輯:張芷菡
本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
[京B2-20230170] [京ICP備17012796號-1]
違法和不良信息舉報電話:18513525309 報料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn
Copyright ©2017-2025 jwview.com. All Rights Reserved
北京中新經(jīng)聞信息科技有限公司