北京大学与360公司联合发布中等量级推理模型TinyR1-32B

				
				文章导读
				
			
			你敢信吗?一个仅32B参数的国产大模型,竟能在安全性上碾压顶尖竞品?北大与360联手发布TinyR1-32B,首创Control Token技术,实现安全模式动态切换——敏感问题自动防御,常规任务精准执行。其安全评分超越Qwen3-32B达25分,力压最新DeepSeek-R1,同时推理性能达到后者93%。更关键的是,它已全面开源,部署门槛大幅降低。这不仅是技术突破,更是安全大模型普惠化的关键一步。
— 内容由好学术AI分析文章内容生成,仅供参考。
				9月23日,北大-360大模型联合实验室发布TinyR1-32B模型,聚焦开源大模型“安全性不足”的行业痛点,实现了安全性能的里程碑式突破,并兼顾出色的推理与通用能力。
技术创新方面,TinyR1-32B模型采用Control Token技术,支持应用侧根据内容安全检测信号动态切换模型工作模式,实现安全与有用性的灵活平衡——遇到安全敏感问题切换至安全模式,在确保安全的同时提供建设性指导;面对通用对齐任务则进入常规模式,保证严格的指令对齐与任务完成度。TinyR1-32B参数量仅为DeepSeek-R1-0528的5%,在安全能力上超过同等规模Qwen3-32B模型25分,以及最新版DeepSeek-R1-0528模型17分,在开源大模型赛道上实现了里程碑式突破。该模型还兼顾强大通用能力,在数学、科学、代码等任务上大幅超过Qwen3-32B,整体推理性能达到DeepSeek R1-0528的93%。目前TinyR1模型已全面开源,支持快速部署于数学推理、科学问答、代码生成、内容安全审核等多类场景,降低安全大模型的应用门槛。研发团队表示未来将持续迭代TinyR1系列,推动形成安全、可信、普惠的大模型生态。
© 版权声明
本文由分享者转载或发布,内容仅供学习和交流,版权归原文作者所有。如有侵权,请留言联系更正或删除。
相关文章
暂无评论...
















 
                 
                
 
                 
                

