印度研究人员开发了一种加速水解制氢反应的氮氧镍电催化剂

科研动态1年前更新 0f6ec722422f273c

1,330 0 0

文章导读

你是否想过，手机只需一句语音指令就能瞬间完成复杂操作？全球首个30亿参数端侧全模态开源模型Megrez-3B-Omni震撼登场！无问芯穹团队突破性地将大模型压缩至黄金尺寸，实现文本、音频、图像三模态无缝切换——中英文语音对话如行云流水，图片OCR识别精准高效，推理速度更领先同类300%。告别云端依赖，端设备从此拥有“全脑”智能：复杂场景实时响应，设置操作一句话搞定。开源纯语言版Megrez-3B-Instruct同步上线，让AI搜索快人一步。即刻解锁端上智能新纪元，你的设备即将进化！

— 内容由好学术AI分析文章内容生成，仅供参考。

印度研究人员开发了一种加速水解制氢反应的氮氧镍电催化剂

12月16日，无问芯穹智能科技有限公司宣布开源其“端模型+端软件+端IP”端上智能一体化解决方案中的小模型，即全球首个端侧全模态理解开源模型Megrez-3B-Omni，并同步开源了纯语言版本模型Megrez-3B-Instruct。无问芯穹技术团队源起于清华大学电子工程系NICS-EFC实验室，在模型压缩、推理加速及硬件能耗优化等领域拥有深入的学术研究和深厚的工程实践经验。

Megrez-3B-Omni是一个为端而生的全模态理解模型，选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸。作为一个全模态模型，Megrez-3B-Omni同时具备文本、音频、图像三种模态数据的处理能力。在文本理解方面，Megrez-3B-Omni将上一代14B大模型压缩至3B规模，降低了计算成本，提升了计算效率；在语音理解方面，该模型支持中英文语音输入，能够处理复杂多轮对话场景，支持对输入图片或文字的语音提问，能够在不同模态间自由切换；在图像理解方面，该模型在场景理解、OCR（光学字符识别）等任务上可识别并提取文本信息。同步开源的纯语言版本模型Megrez-3B-Instruct为单模态模型，最大推理速度领先同精度模型300%，具备AI搜索功能。无问芯穹表示，接下来还将持续迭代Megrez系列，让用户只需要给出简单的语音指令，就可完成端设备的设置或应用操作，并将它作为“端模型+端软件+端IP”端上智能一体化解决方案的重要构成推向市场。