專訪呼娜英：AI安全“隱形戰(zhàn)場”上，如何破解全鏈條風(fēng)險？

2025-02-18 14:20:56 中新經(jīng)緯

　　中新經(jīng)緯2月18日電 (孫慶陽)“人工智能的安全與可用性面臨全鏈條、多維度交織的復(fù)雜風(fēng)險挑戰(zhàn)，需通過國際合作、技術(shù)創(chuàng)新和標(biāo)準(zhǔn)制定來應(yīng)對�！苯�，中國信息通信研究院人工智能研究所高級業(yè)務(wù)主管呼娜英在巴黎人工智能(AI)行動峰會后接受中新經(jīng)緯專訪時表示，未來五到十年，人工智能技術(shù)將持續(xù)深化，增強(qiáng)語言大模型能力是重點方向。同時，多模態(tài)模型有望加速突破，提升圖文理解和跨模態(tài)交互能力。

　　呼娜英受訪者供圖

　　網(wǎng)絡(luò)和框架是AI系統(tǒng)安全的根基

　　在最近的巴黎人工智能(AI)行動峰會上，AI安全性和可用性成為了全球AI產(chǎn)業(yè)人士的共同關(guān)注焦點。呼娜英指出，當(dāng)前AI在安全性和可用性方面面臨的是全鏈條、多維度相互交織的復(fù)雜風(fēng)險挑戰(zhàn)。隨著人工智能模型復(fù)雜度和規(guī)模的不斷提升，其訓(xùn)練、部署、應(yīng)用等關(guān)鍵環(huán)節(jié)中面臨的數(shù)據(jù)安全、網(wǎng)絡(luò)安全、框架安全、模型算法安全以及應(yīng)用平臺安全問題日益突出。

　　在基礎(chǔ)設(shè)施方面，網(wǎng)絡(luò)安全和框架安全關(guān)乎整個AI系統(tǒng)的穩(wěn)定運(yùn)行根基。以DeepSeek為例，R1模型在剛剛上線提供服務(wù)后，便遭到大規(guī)模DDoS(分布式阻斷服務(wù))攻擊，導(dǎo)致服務(wù)中斷，用戶無法正常訪問。在數(shù)據(jù)方面，訓(xùn)練數(shù)據(jù)被“投毒”(通過惡意注入虛假或誤導(dǎo)性的數(shù)據(jù)來污染模型的訓(xùn)練數(shù)據(jù)集)，以及訓(xùn)練使用敏感行業(yè)數(shù)據(jù)、個人隱私數(shù)據(jù)等，一旦數(shù)據(jù)被“投毒”，訓(xùn)練出的模型將產(chǎn)生偏差，做出錯誤決策，而敏感數(shù)據(jù)的不當(dāng)使用則可能引發(fā)嚴(yán)重的法律風(fēng)險和社會信任危機(jī)。

　　在模型算法層面，以大模型為代表的生成式模型面臨嚴(yán)峻的越獄攻擊、提示詞注入攻擊等威脅，模型容易在用戶惡意操作下輸出違法有害或侵害權(quán)益的信息。

　　此外，模型的“幻覺”(模型生成的不真實、編造或與上下文不一致的內(nèi)容)問題突出，也成為了制約人工智能產(chǎn)業(yè)化落地的重要因素。在應(yīng)用層面，人工智能技術(shù)容易被濫用和誤用，比如利用圖像生成技術(shù)偽造虛假新聞圖片誤導(dǎo)公眾，或在自動化決策系統(tǒng)中因算法偏見導(dǎo)致對特定群體的不公平對待，這些行為嚴(yán)重擾亂了正常的社會秩序與市場環(huán)境。

　　如何顯著提升AI系統(tǒng)安全性？

　　呼娜英強(qiáng)調(diào)，全球均在探索風(fēng)險管理的可行路徑，針對人工智能風(fēng)險開展有效的“識別、評估、應(yīng)對”方案一定程度上成為共識。其中，最重要的一環(huán)是對于安全問題的檢測技術(shù)和防護(hù)手段。在檢測方面，一是形成對于開源框架、源代碼以及網(wǎng)絡(luò)等軟硬件基礎(chǔ)設(shè)施的漏洞挖掘技術(shù)，精準(zhǔn)定位潛在隱患。特別是開源框架、代碼中存在的未被發(fā)現(xiàn)的漏洞，極易被利用實施大規(guī)模的攻擊和勒索。如去年年初，人工智能開源框架Ray被發(fā)現(xiàn)存在漏洞，并被攻擊人員利用攻擊數(shù)百個集群。

　　二是形成數(shù)據(jù)“投毒”檢測技術(shù)，用于守護(hù)訓(xùn)練數(shù)據(jù)的純凈性，防范通過訓(xùn)練的方式，在模型中埋入后門。

　　三是建立大模型等模型算法漏洞自動化測試技術(shù)，掃描算法中的薄弱環(huán)節(jié)，快速生成測試報告。

　　四是基于現(xiàn)有的自動化滲透技術(shù)能力，形成面向人臉識別、智能體等人工智能典型應(yīng)用的自動化滲透技術(shù)產(chǎn)品，模擬黑客攻擊，全方位探測應(yīng)用平臺的安全漏洞，充分發(fā)掘人工智能各方面的安全風(fēng)險。

　　呼娜英還指出，在防護(hù)層面，需要探索軟硬件基礎(chǔ)設(shè)施的漏洞自動化修復(fù)技術(shù)，自動修復(fù)受損代碼，降低安全風(fēng)險。此外，還可以探索實踐模型漏洞自動化微調(diào)和加固技術(shù)，對模型進(jìn)行自動化優(yōu)化，增強(qiáng)其抵御攻擊的能力，保障人工智能系統(tǒng)穩(wěn)定、安全地運(yùn)行。

　　中國智慧引領(lǐng)未來AI治理新格局

　　呼娜英認(rèn)為，推動人工智能安全治理合作依然是勢不可擋的，也是確有必要的。人工智能的開發(fā)、部署和使用具有全球化特征，人工智能技術(shù)的應(yīng)用與影響并非局限于某一地區(qū)或國家，而是深刻影響全球社會、經(jīng)濟(jì)和政治秩序。為人類共同未來建立務(wù)實可行的國際對話與合作機(jī)制，需要多方努力。未來，國際社會應(yīng)在聯(lián)合國框架下凝聚各方共識，依托國際標(biāo)準(zhǔn)化組織深化技術(shù)標(biāo)準(zhǔn)協(xié)同，務(wù)實推進(jìn)人工智能安全治理工作。

　　一直以來，中國在全球人工智能治理領(lǐng)域積極作為并推動加強(qiáng)國際合作。例如，中國信通院積極參與國際標(biāo)準(zhǔn)制定，發(fā)起《人工智能安全承諾》促進(jìn)行業(yè)自律，下一步將依托工業(yè)和信息化部人工智能技術(shù)標(biāo)準(zhǔn)委員會，持續(xù)完善國內(nèi)標(biāo)準(zhǔn)體系，推動安全測試、風(fēng)險評估、可信要求等技術(shù)規(guī)范轉(zhuǎn)化為國際共識，促進(jìn)技術(shù)標(biāo)準(zhǔn)和指引的深入實踐與應(yīng)用。

　　呼娜英預(yù)測，未來五到十年內(nèi)，人工智能技術(shù)將持續(xù)深化演進(jìn)。一方面，增強(qiáng)語言大模型能力仍是技術(shù)升級的重點方向之一，推理或?qū)@得更多關(guān)注和資源投入。另一方面，多模態(tài)模型有望加速突破，從以語言大模型為骨干的多模態(tài)模型，向原生多模態(tài)模型演變，提升圖文理解和跨模態(tài)交互能力。

　　呼娜英認(rèn)為，在安全與可用性方面，以下趨勢值得關(guān)注：在風(fēng)險識別方面，隨著人工智能技術(shù)日益融入經(jīng)濟(jì)社會發(fā)展各領(lǐng)域全過程，其安全風(fēng)險面不斷擴(kuò)大，對人工智能安全風(fēng)險識別方法論的研究將不斷完善，從而催生更加敏捷、精準(zhǔn)的安全風(fēng)險識別機(jī)制。在風(fēng)險應(yīng)對方面，對算法模型毒性、魯棒性、公平性等方面的評測技術(shù)工具研究將不斷加強(qiáng)，將人工智能基礎(chǔ)設(shè)施、算法模型、上層應(yīng)用以及產(chǎn)業(yè)鏈等方面作為評估重點，并在機(jī)制方案上動態(tài)迭代、技術(shù)能力上持續(xù)提升，從而有效防范和應(yīng)對治理風(fēng)險。(中新經(jīng)緯APP)

　　中新經(jīng)緯版權(quán)所有，未經(jīng)授權(quán)，不得轉(zhuǎn)載或以其他方式使用。

責(zé)任編輯：張芷菡

來源：中新經(jīng)緯

編輯：王永樂

廣告等商務(wù)合作，請點擊這里

未經(jīng)過正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文，侵權(quán)必究

中新經(jīng)緯版權(quán)所有，未經(jīng)書面授權(quán)，任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用。

關(guān)注中新經(jīng)緯微信公眾號(微信搜索“中新經(jīng)緯”或“jwview”)，看更多精彩財經(jīng)資訊。

今日推薦