北京大学与360公司联合发布中等量级推理模型TinyR1-32B

查找参加最新学术会议,发表EI、SCI论文,上学术会议云
2025年第四届算法、数据挖掘与信息技术国际会议(ADMIT 2025)
2025年第八届机器学习和自然语言处理国际会议(MLNLP 2025)
2025年第八届数据科学和信息技术国际会议(DSIT 2025)
2025年数据科学与智能系统国际会议(DSIS 2025)
2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)
2025年第二届亚太计算技术、通信和网络会议(CTCNet 2025)
艾思科蓝 | 学术会议 | 学术期刊 | 论文辅导 | 论文编译 | 发表支持 | 论文查重

北京大学与360公司联合发布中等量级推理模型TinyR1-32B

文章导读
你敢信吗?一个仅32B参数的国产大模型,竟能在安全性上碾压顶尖竞品?北大与360联手发布TinyR1-32B,首创Control Token技术,实现安全模式动态切换——敏感问题自动防御,常规任务精准执行。其安全评分超越Qwen3-32B达25分,力压最新DeepSeek-R1,同时推理性能达到后者93%。更关键的是,它已全面开源,部署门槛大幅降低。这不仅是技术突破,更是安全大模型普惠化的关键一步。
— 内容由好学术AI分析文章内容生成,仅供参考。

923日,北大-360大模型联合实验室发布TinyR1-32B模型,聚焦开源大模型安全性不足的行业痛点,实现了安全性能的里程碑式突破,并兼顾出色的推理与通用能力。

技术创新方面,TinyR1-32B模型采用Control Token技术,支持应用侧根据内容安全检测信号动态切换模型工作模式,实现安全与有用性的灵活平衡——遇到安全敏感问题切换至安全模式,在确保安全的同时提供建设性指导;面对通用对齐任务则进入常规模式,保证严格的指令对齐与任务完成度。TinyR1-32B参数量仅为DeepSeek-R1-05285%,在安全能力上超过同等规模Qwen3-32B模型25分,以及最新版DeepSeek-R1-0528模型17分,在开源大模型赛道上实现了里程碑式突破。该模型还兼顾强大通用能力,在数学、科学、代码等任务上大幅超过Qwen3-32B,整体推理性能达到DeepSeek R1-052893%。目前TinyR1模型已全面开源,支持快速部署于数学推理、科学问答、代码生成、内容安全审核等多类场景,降低安全大模型的应用门槛。研发团队表示未来将持续迭代TinyR1系列,推动形成安全、可信、普惠的大模型生态。

© 版权声明
2025年第四届算法、数据挖掘与信息技术国际会议(ADMIT 2025)
2025年第八届机器学习和自然语言处理国际会议(MLNLP 2025)
2025年第八届数据科学和信息技术国际会议(DSIT 2025)
2025年数据科学与智能系统国际会议(DSIS 2025)
第二届大数据分析与人工智能应用学术会议(BDAIA2025)
2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)
2025年第二届亚太计算技术、通信和网络会议(CTCNet 2025)
艾思科蓝 | 学术会议 | 学术期刊 | 论文辅导 | 论文编译 | 发表支持 | 论文查重

相关文章

查找最新学术会议,发表EI、SCI论文,上学术会议云
艾思科蓝 | 学术会议 | 学术期刊 | 论文辅导 | 论文编译 | 发表支持 | 论文查重

暂无评论

none
暂无评论...