(資料圖)

中新網(wǎng)北京3月27日電 (賈君玉 張素)記者近日采訪清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授黃民烈獲悉,歷時(shí)兩年多時(shí)間,由他帶領(lǐng)的科研團(tuán)隊(duì)建立了大模型安全分類(lèi)體系,并從系統(tǒng)層面和模型層面等打造了大模型安全框架。

近年來(lái),隨著技術(shù)突破,大模型獲得快速發(fā)展并在多個(gè)場(chǎng)景得到應(yīng)用。不過(guò),其存在的事實(shí)性錯(cuò)誤、知識(shí)盲區(qū)等問(wèn)題,以及面臨的訓(xùn)練數(shù)據(jù)來(lái)源合規(guī)性、生成內(nèi)容安全性等風(fēng)險(xiǎn),也已受到廣泛關(guān)注。

在黃民烈看來(lái),要規(guī)避安全風(fēng)險(xiǎn),降低人工智能對(duì)人類(lèi)的負(fù)面影響,關(guān)鍵在于大模型底座。“大規(guī)模語(yǔ)言模型(LLM)發(fā)展到現(xiàn)在,模型結(jié)構(gòu)和規(guī)模已有很大進(jìn)展,但實(shí)用性還有待加強(qiáng),我們應(yīng)該通過(guò)技術(shù)讓模型更加安全、可控,使其快速適配更多的應(yīng)用場(chǎng)景。”他說(shuō)。

此次,聆心智能聯(lián)合清華大學(xué)CoAI實(shí)驗(yàn)室共同發(fā)布大模型安全評(píng)估框架。作為聆心智能的創(chuàng)始人,黃民烈介紹說(shuō),他們希望通過(guò)對(duì)大模型應(yīng)用邊界進(jìn)行定義,促進(jìn)大模型生態(tài)健康發(fā)展,推動(dòng)人工智能研究和應(yīng)用向更有用、更可信、更安全邁進(jìn)。

據(jù)知,黃民烈團(tuán)隊(duì)建立的大模型安全分類(lèi)體系中設(shè)定的不安全對(duì)話場(chǎng)景,包括犯罪違法、身體健康、心理健康、財(cái)產(chǎn)隱私、歧視/偏見(jiàn)、辱罵/仇恨言論等方面。科研人員針對(duì)這些安全場(chǎng)景對(duì)大模型進(jìn)行升級(jí),使之具備基本的安全性,“能夠在遇到安全問(wèn)題時(shí)給予正確的回復(fù)策略,不進(jìn)行判斷誤導(dǎo)”。

此外,著眼于容易觸發(fā)的安全問(wèn)題類(lèi)型,科研團(tuán)隊(duì)還總結(jié)、設(shè)計(jì)出一般模型難以處理的“安全攻擊方式”,使安全體系更加完善。

黃民烈表示,未來(lái),他們將打造中文大模型的安全風(fēng)險(xiǎn)評(píng)估的Leaderboard,為國(guó)內(nèi)對(duì)話大模型的安全評(píng)估提供公平公開(kāi)的測(cè)試平臺(tái),并提供針對(duì)中文對(duì)話的安全場(chǎng)景等,“依托自身核心技術(shù),在可控可信的超擬人大模型基礎(chǔ)之上,通過(guò)建立安全、可控的模型邊界,讓人工智能提供可信、可靠的輸出”。(完)

熱點(diǎn)圖片

備案號(hào):贛ICP備2022005379號(hào)-1
華網(wǎng)(http://www.b3q24.cn) 版權(quán)所有未經(jīng)同意不得復(fù)制或鏡像

聯(lián)系電話:17051177829 QQ:51985809郵箱:51985809@qq.com

主站蜘蛛池模板: 亚州视频在线 | 色婷婷综合在线观看 | 久久亚洲精品国产一区 | 久久免费看 | 在线毛片免费 | 在线男人天堂 | 日韩欧美在线观看视频 | 久久天天躁夜夜躁狠狠 | 国产区在线观看 | 亚洲wuma | 看逼网站| 国产视频成人 | 国产成人黄色 | 久久精品女人天堂avapp下载 | 免费黄片毛片 | 麻豆入口 | 成人性视频免费看的鲁片 | 国产精品视频网站 | 成人国产免费 | 亚洲成aⅴ人在线观看 | 天堂影院在线免费观看电影电视剧 | 中文字幕18页 | 国产第一页在线播放 | 九色国产视频 | 91丨九色丨国产在线 | 日韩精品中文字幕在线观看 | 国产亚洲精品美女 | 日韩电影黄 | 91欧美激情一区二区三区成人 | 青青草国产成人av片免费 | 一级久久久久久久 | 欧美日本一区 | 国产成a人亚洲精v品在线观看 | 国产一区二区三区电影在线观看 | 日韩精品在线一区 | 新四虎 | 蜜臀91精品国产高清在线观看 | 性生大片免费看 | 黄色软件免费的 | 免费日本视频 | 岛国a级片 |