當前位置: 主頁 > 科技 >

        信息安全共性技術國家工程研究中心推出【生成式大模型評測服務】

        時間:2023-08-31來源:互聯網 作者:編輯 點擊:
        在當今飛速發展的數字時代,生成式大模型正以其令人矚目的創意能力和潛力引領著人工智能領域的前沿。 作為一種集合了復雜算法、海量數據和深度學習技術的產物,生成式大模型已

        在當今飛速發展的數字時代,生成式大模型正以其令人矚目的創意能力和潛力引領著人工智能領域的前沿。

        作為一種集合了復雜算法、海量數據和深度學習技術的產物,生成式大模型已經廣泛應用于自然語言處理、創意生成、智能對話等領域。然而,盡管其在創造性和創新性方面取得了巨大成功,但也不可避免地面臨著一些潛在風險和挑戰。

        為了迎接大模型帶來的數字化變革,工程中心基于《生成式人工智能服務管理暫行辦法》推出了大模型評測維服務。

        一、生成式大模型 風險與挑戰

        隨著生成式大模型的廣泛應用,一些問題也開始浮現。其中包括信息可信度的問題,模型可能會誤導用戶或產生不準確的內容;另外,隱私和數據安全也成為了關切的焦點,模型可能會泄露敏感信息。因此,在探索生成式大模型的無限潛力的同時,科學評測其風險勢在必行。

        1、數據安全與合規風險問題

        數據樣本的隱私性、知識產權、數據質量可能無法得到有效保護,從而導致生成式人工智能輸出內容異常;

        惡意用戶可能利用系統漏洞,運用特定手段導致模型數據泄露, 以及一些不良信息的輸出;

        2、對話與輸出機制——用戶風險與價值風險

        模型可能因為無法審核帶有誘導性的指令, 或無法判斷生成結果的影響, 導致輸出不良信息;

        生成的內容可能包含錯誤、不準確或無法驗證的信息, 模型可能在處理特定問題時在邏輯上缺乏一致性和連貫性;

        3、政策導向——國內監管日趨加強

        (1)2023年4月中共中央政治局召開會議,分析研究當前經濟形勢和經濟工作。會議提出要重視通用人工智能發展,營造創新生態,重視防范風險。

        (2)2023年5月,北京市人民政府辦公廳印發了《北京市促進通用人工智能創新發展的若干措施》,加強了大模型等通用人工智能的評測監管。

        其中,第九條強調:“建設大模型評測開放服務平臺,建立公平高效的自適應評測體系,根據不同目標和任務,實現大模型自動適配評測。”

        (3)2023年7月七部門聯合公布《生成式人工智能服務管理暫行辦法》,自2023年8月15日起施行。

        《辦法》明確生成式人工智能服務提供者應當依法開展預訓練、優化訓練等訓練數據處理活動,使用具有合法來源的數據和基礎模型;涉及知識產權的,不得侵害他人依法享有的知識產權;涉及個人信息的,應當取得個人同意或者符合法律、行政法規規定的其他情形;采取有效措施提高訓練數據質量,增強訓練數據的真實性、準確性、客觀性、多樣性。此外,明確了數據標注的相關要求。

        二、工程中心生成式大模型評測服務

        為了迎接大模型帶來的數字化變革,工程中心基于《生成式人工智能服務管理暫行辦法》制定了全新的評測維度,形成大模型評測服務,為模型的全面性能評估提供了更多的視角,可有效提升大模型服務的透明度,提高生成內容的準確性和可靠性。

        工程中心大模型評測服務從穩定性、交互性、應用性、安全性、魯棒性五大評測維度等多角度出發,針對生成式人工智能模型目前存在問題,進行全方位評測,不僅涵蓋當前主流評測體系的評測維度,還引入了一些新的維度來評估模型的性能和合規性。

        模型穩定性評測

        模型穩定性測評是評估模型在非常規輸入下能否提供安全穩定的服務,用于測試大模型在各種場景下的穩定性和性能。這有助于評估模型在實際應用中是否能夠滿足需求。

        模型交互性和應用性評測

        具體包括了多語種評測、語言流暢度、情感分析、代碼評測、專業翻譯、摘要能力、百科知識、邏輯推理等多個子項。通過這些評測子項,可以全方位衡量大模型的表現和能力。

        模型安全性評測

        模型安全性主要包含模型可以避免虛假、歧視信息輸出、數據合規檢查以及環境安全檢測等多個子項,為模型可靠性和安全性提供應用依據。

        工程中心大模型評測服務以法律層面《個人信息保護法》、《網絡安全法》、《中華人民共和國數據安全法》、《中華人民共和國密碼法》等法律要求;國家標準層面《GB_T 22239-2019信息安全技術 網絡安全等級保護基本要求》、《GB-T 39412-2020 信息安全技術 代碼安全審計規范》、《GB_T 25000.10-2016 系統與軟件工程 系統與軟件質量要求和評價SQuaRE 第10部分系統與軟件質量模型》、《GB_T 41479-2022 信息安全技術 網絡數據處理安全要求》、《GM/T 0054-2018信息安全技術 信息系統密碼應用基本要求》、《GB/T 20984-2022信息安全技術 信息安全風險評估方法》等標準;為支撐實現大模型軟件安全、等級保護、密碼評估、風險評估、代碼審計、數據安全等合規性的評測。

        模型魯棒性評測

        模型魯棒性主要包含模型可以抵御惡意數據的輸入、防止隱私泄露以及模型輸出的可解釋性,從測試數據攻擊、訓練數據投毒、隱私泄露以及可解釋性多角度出發進行評測。

        了解更多服務詳情可通過工程中心官方微信【信息安全國家工程研究中心】聯系交流。

        讓我們共同創造一個安全、可靠的人工智能未來!

        頂一下
        (0)
        0%
        踩一下
        (0)
        0%
        ------分隔線----------------------------
        發表評論
        請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
        評價:
        文章導航
        推薦內容
        主站蜘蛛池模板: 日本中文字幕乱理伦片| 真实处破女系列全过程| 图片区小说校园综合| 久久久www成人免费精品| 欧美日韩第一页| 再一深点灬舒服灬太大了视频| 国产chinesehd精品酒店| 在线不卡免费视频| 中国欧美日韩一区二区三区| 色综合久久久久综合99 | 国产熟女高潮视频| a级毛片高清免费视频在线播放| 日本a∨在线播放高清| 亚洲av永久无码| 毛片免费视频播放| 八区精品色欲人妻综合网| 韩国三级bd高清中文字幕合集| 国产精品极品美女自在线观看 | 欧美精品一区二区三区在线| 动漫人物美女被吸乳羞羞动漫 | 高清国产一级精品毛片基地| 国产精品资源在线观看| wwwxxxx在线观看| 扒开女人双腿猛进入爽爽视频| 久草福利资源站| 欧美成人久久久| 亚洲美女视频一区| 综合人妻久久一区二区精品| 国产午夜精品一区二区| 中文字幕免费在线看线人| 国内精品伊人久久久久妇| yy6080理论午夜一级毛片| 新梅瓶1一5集在线观看| 久久精品国产福利电影网| 欧美人与性动交另类| 亚洲男人的天堂网站| 男人天堂伊人网| 午夜福利无码不卡在线观看| 蜜桃成熟时3d国语| 国产午夜精品理论片| 久久伊人色综合|