清华团队推出“安全增强版DeepSeek”
人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。
近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。
基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。
据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。
- 2025-02-24主产区进入春灌春播季节 全国春灌面积已超1000万亩
- 2025-02-24推动健康食品行业发展 业界:向科学要答案、向科技要力量
- 2025-02-242025年铁路春运圆满收官 客货运量均创春运历史新高
- 2025-02-24超90亿人次勾勒出流动中国 彰显经济发展活力






