<ul id="ouw02"></ul>
  • 手機版 | 網站導航
    觀察家網 > 財經 >

    給狂飆的大模型系上“安全帶”,瑞萊智慧發布全新AI安全平臺RealSafe

    財訊網 | 2023-07-11 21:05:13

    近幾個月來,以ChatGPT為代表的生成式人工智能狂飆突進,大模型時代已然降臨。在“百模大戰”越戰越酣之時,大模型其內生及衍生安全威脅也愈演愈烈,數據泄露、幻想、生產歧視、排斥和有害內容等安全問題層出不窮。

    如何將制約大模型應用發展的“絆腳石”變為“壓艙石”?

    7月7日,清華大學人工智能研究院孵化企業瑞萊智慧RealAI在2023WAIC世界人工智能大會上,重磅發布了全新人工智能安全平臺RealSafe3.0,為“加速度”發展中的大模型系好“安全帶”、把好“方向盤”。

    瑞萊智慧RealAI聯合創始人、算法科學家

    現狀:“雙刃劍”效應,制約大模型落地

    和所有通用目的技術一樣,自人工智能誕生的那一刻起,創造技術的力量和控制技術的力量就存在不對等。新技術必然會帶來新的安全問題,這正是技術兩面性。大模型亦是如此,盡管它的強大已讓人類瞥見了通用人工智能的曙光,但也讓眾多學界、業界人士心生憂懼。前不久,就有全球400多位專家發布聯名公開信,警告人工智能發展速度過快,缺乏監管,可能會危及人類生存。

    他們的擔憂并非危言聳聽。近段時間以來,關于大模型的安全隱患屢見不鮮,例如:機密文件被泄露、添加無意義的字符后模型竟給出完全相反的回答、輸出違法有害內容、隱含對某些人類社群的偏見和歧視等等。

    這一新興技術帶來的風險,已經引起世界各國的高度關注。國家互聯網信息辦公室4月11日起草《生成式人工智能服務管理辦法(征求意見稿)》公開征求意見;歐盟于6月14日投票通過了《人工智能法案》,以期法律法規引領技術向好向善發展。

    瑞萊智慧聯合創始人、算法科學家蕭子豪認為,大模型“落地難”的本質在于,當前仍處于“野蠻生長”階段,還沒有找到場景、風險和規范三者之間的平衡點。而在探尋這一平衡點的過程中,缺少易用和標準化的工具,即在技術層面上缺乏有力抓手,能夠科學評判大模型在場景中能否同時滿足規范和低風險,且能夠進一步定位問題并給出優化建議,助力模型上線運行。

    出路:源頭上找癥結,技術上找對策

    因此,瑞萊智慧在2023世界人工智能大會上,正式發布人工智能安全平臺RealSafe3.0版本。它是集成主流及RealAI獨有的世界領先的安全評測技術,能夠提供端到端的模型安全性測評解決方案,解決當前通用大模型安全風險難以審計的痛點問題。

    相較上一版本,RealSafe3.0新增了對通用大模型的評測,在評測維度上,它已覆蓋數據安全、認知任務、通用模型特有漏洞、濫用場景等近70個評測維度,全方位多維度地評測通用大模型的性能,且未來還會持續擴增測評維度的數量。

    “評測只是手段,幫助通用大模型提升其自身安全性才是核心目的。”蕭子豪說,不能因為對于被技術反噬的擔憂就止步不前,創造新技術和控制技術危害應該同步進行,“瑞萊智慧的辦法是,從源頭上找到癥結,再用‘魔法’打敗‘魔法’。”

    如果將人工智能模型比作“引擎”,數據則是模型的“燃料”。可以說,數據集質量直接影響模型的內生安全。因此,RealSafe3.0內部集成了多個自研模型和專家論證高質量數據集,來幫助用戶修復模型中的問題。

    對黑盒不可解釋的通用大模型,自研紅隊對抗模型取代人工設計問題,顯著提升攻擊成功率和樣本多樣性。也就是說,該模型數據集中,不僅包含了自有數據集,還包含了模型自生成的數據,無論是從數據質量還是數據規模上都可圈可點,因此它能夠自動化地挖掘出更多的漏洞,真正從源頭上緩解安全問題。

    教練模型則通過對被測大模型進行多輪次的提問-回答訓練,并以訓練好的評分模型對問答結果進行評分,再將評分結果反饋給大模型,使其不斷強化學習到好壞答案的要點及區別,直至問答能力逐步迭代至最優。除了定制化的訓練框架,教練模型理想的模型效果還得益于夯實的數據基礎,瑞萊智慧自有數據集經過數十位價值觀領域的專家論證,以確保輸入的數據無誤,質量高且領域多元,未來也將持續更新補充。

    蕭子豪透露:“這些技術,都是基于自研多模態大模型底座實現的。”

    瑞萊智慧人工智能安全平臺RealSafe3.0通用大模型測評及優化工作流程

    結語:用AI打敗AI,用智慧駕馭智能

    除了可提升生成式大模型安全性的RealSafe3.0,瑞萊智慧此次還帶來了能夠防范生成式人工智能惡意濫用的DeepReal2.0。據悉,DeepReal此前名為深度偽造內容檢測平臺,現已正式更名為生成式人工智能內容檢測平臺,因為它除了能夠檢測Deepfake內容,還新增兩個功能模塊,可以檢測Diffusion、LLM這兩類新方法生成的數據,支持對圖像、視頻、音頻、文本進行是否偽造的檢測。應用場景包括打擊網絡詐騙和聲譽侵害行為、檢測網絡內容合規性、檢測音視頻物證真實性等,可對生成式人工智能技術濫用行為進行管控和治理。

    自2018年成立以來,瑞萊智慧就致力于研究和發展安全可控的第三代人工智能技術,建立通用AI模型能力和人工智能安全能力:通過通用人工智能模型來適應各類復雜的智能應用場景和任務;并通過人工智能安全能力,真正使AI造福人類整體利益。

    瑞萊智慧堅持源頭創新和底層研究,在生成式人工智能等領域不斷發表世界領先科研成果。成立以來,瑞萊智慧研發團隊核心成員在人工智能領域頂會上發表論文數百篇,多次在國際測評和競賽中斬獲冠軍,獲得授權專利100余項。同時,瑞萊智慧積極推動行業規范化,累計參與30余項國家標準、行業標準制定。此外,瑞萊智慧已與網信辦、工信部、公安部及下屬多家單位展開深入的項目合作。

    “從古至今,技術始終都是一把‘雙刃劍’。通用人工智能的時代必將到來,如何讓人工智能揚長避短,如何用人類智慧駕馭人工智能,是從業者的一道長久課題。”蕭子豪說,這也是瑞萊智慧一直努力的方向。未來,RealSafe3.0將在保障通用大模型和專有模型安全、可靠、可控上,發揮強大作用。瑞萊智慧也將持續迭代技術、打磨產品,以確保在這場人工智能安全“攻防戰”中始終立于不敗之地,將人工智能的兩面性這一“關鍵變量”,轉化為高質量發展的“最大增量”。

    免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

    標簽:

    • 標簽:中國觀察家網,商業門戶網站,新聞,專題,財經,新媒體,焦點,排行,教育,熱點,行業,消費,互聯網,科技,國際,文化,時事,社會,國內,健康,產業資訊,房產,體育。

    相關推薦

    亚洲高清无码在线观看| 亚洲美女自拍视频| 亚洲一级视频在线观看| 亚洲va在线va天堂va888www| 国产亚洲精AA在线观看SEE| 国产精品V亚洲精品V日韩精品 | 久久亚洲AV成人无码国产电影| 亚洲色偷偷偷综合网| 亚洲最大中文字幕无码网站| 亚洲一本到无码av中文字幕| 亚洲最大的成人网| 亚洲AV无码一区二区一二区| 国产精品亚洲专区无码WEB| 天堂亚洲免费视频| 久久精品国产亚洲Aⅴ香蕉 | 亚洲国产精品成人一区| 亚洲国产精品一区二区第一页免| 亚洲国产黄在线观看| 久久亚洲国产成人影院网站| 永久亚洲成a人片777777| 国产V亚洲V天堂无码| 亚洲国产精品人久久| 亚洲图片校园春色| 在线亚洲高清揄拍自拍一品区| 亚洲AV色欲色欲WWW| 亚洲精品成a人在线观看| 亚洲无线码一区二区三区| 亚洲第一AAAAA片| 久久亚洲AV成人无码软件| 亚洲同性男gay网站在线观看| 亚洲а∨天堂久久精品9966| 日韩色日韩视频亚洲网站| 亚洲午夜福利精品久久| 国产V亚洲V天堂A无码| 亚洲欧洲精品视频在线观看| 在线综合亚洲欧洲综合网站| 亚洲AV无码之日韩精品| 亚洲人成网77777色在线播放| 久久夜色精品国产噜噜亚洲AV| wwwxxx亚洲| 一本色道久久88亚洲综合|