北京大学与360公司联合发布中等量级推理模型TinyR1-32B

科研动态8个月前更新 0f6ec722422f273c

1,271 0 0

北京大学与360公司联合发布中等量级推理模型TinyR1-32B

文章导读

你敢信吗？一个仅32B参数的国产大模型，竟能在安全性上碾压顶尖竞品？北大与360联手发布TinyR1-32B，首创Control Token技术，实现安全模式动态切换——敏感问题自动防御，常规任务精准执行。其安全评分超越Qwen3-32B达25分，力压最新DeepSeek-R1，同时推理性能达到后者93%。更关键的是，它已全面开源，部署门槛大幅降低。这不仅是技术突破，更是安全大模型普惠化的关键一步。

— 内容由好学术AI分析文章内容生成，仅供参考。

9月23日，北大-360大模型联合实验室发布TinyR1-32B模型，聚焦开源大模型“安全性不足”的行业痛点，实现了安全性能的里程碑式突破，并兼顾出色的推理与通用能力。

技术创新方面，TinyR1-32B模型采用Control Token技术，支持应用侧根据内容安全检测信号动态切换模型工作模式，实现安全与有用性的灵活平衡——遇到安全敏感问题切换至安全模式，在确保安全的同时提供建设性指导；面对通用对齐任务则进入常规模式，保证严格的指令对齐与任务完成度。TinyR1-32B参数量仅为DeepSeek-R1-0528的5%，在安全能力上超过同等规模Qwen3-32B模型25分，以及最新版DeepSeek-R1-0528模型17分，在开源大模型赛道上实现了里程碑式突破。该模型还兼顾强大通用能力，在数学、科学、代码等任务上大幅超过Qwen3-32B，整体推理性能达到DeepSeek R1-0528的93%。目前TinyR1模型已全面开源，支持快速部署于数学推理、科学问答、代码生成、内容安全审核等多类场景，降低安全大模型的应用门槛。研发团队表示未来将持续迭代TinyR1系列，推动形成安全、可信、普惠的大模型生态。