<匯港通訊> 中國科技巨頭華為與浙江大學聯合發布國內首個基於昇騰千卡算力平台的DeepSeek-R1-Safe基礎大模型,聲稱針對有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題,整體防禦成功率近100%。
中國工程院院士陳純稱,DeepSeek-R1-Safe的發布旨在打造安全可信的示範應用,推動大模型安全能力與產業生態協同發展。
華為介紹,模型研發團隊首次實現基於華為昇騰千卡算力平台的千億級參數滿血版大模型安全訓練。
測試結果表明,DeepSeek-R1-Safe針對有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題,整體防禦成功率近100%;針對情境假設、角色扮演、加密編碼等多個越獄模式整體防禦成功率超過40%。其綜合安全防御能力達83%。
內地私募巨頭幻方量化旗下開源模型公司DeepSeek(深度求索)1月發布模型DeepSeek-R1。這意味着第三方開發者能夠基於該公司的模型進行修改與二次開發。 (WL)
新聞來源 (不包括新聞圖片): 滙港資訊