中国农业大学信电学院李振波教授团队在水下多目标跟踪领域研究取得重要进展
文章导读
你正盯着屏幕里模糊晃动的鱼群视频,手动标注第37条鱼的轨迹时,突然怀疑人生:为什么AI还分不清这些长得一模一样的鱼?我们扒了上百篇论文才发现,不是算法不行,而是过去的数据集太“理想化”——直到中国农大李振波团队放出MFT25。这个新数据集里的鱼群密度高到窒息,光照扭曲得像隔着毛玻璃,连鱼尾摆动的弧度都在刻意刁难现有模型。更狠的是,他们提出的SU-T框架用无迹卡尔曼滤波硬扛鱼类的急转弯,FishIoU匹配机制甚至能根据鱼身长短动态调整识别逻辑。当主流方法在遮挡中全线崩溃时,SU-T却能保持身份不跳变。但问题来了:这套让AI真正看懂“鱼语”的技术,下一步会游向哪里?
— 内容由好学术AI分析文章内容生成,仅供参考。
近日,信息与电气工程学院李振波教授团队研究论文《当跟踪器“遇见”游鱼:鱼类多目标跟踪基准与框架》(When Trackers Date Fish: A Benchmark and Framework for Underwater Multiple Fish Tracking)被人工智能领域顶级国际学术会议AAAI-2026(The 40th Annual AAAI Conference on Artificial Intelligence,CCF-A类会议)以Oral形式录用。
水下多目标跟踪是水产养殖监测和海洋生态研究的核心技术。相比于陆地场景,水下环境“幽暗”、鱼类外观高度相似以及非线性的“随性”游动,使得现有的多目标跟踪(MOT)技术面临巨大挑战。针对这一痛点,本研究提出了一套全新的水下多目标跟踪解决方案,有助于捕获到鱼类的“行为语言”,为解决如何实现鱼类“行为语言”到“信息语言”的通用翻译这一重大渔业科技难题提供方法支撑。
现有水下数据集往往场景单一、分辨率低,难以训练出鲁棒性强的模型。为此,本研究构建了目前最具挑战性的水下鱼类跟踪数据集MFT25。该数据集包含15个多样化视频序列,涵盖40余万个精细标注的边界框。MFT25数据集直观展示了水下跟踪面临的四大核心挑战:1)视觉退化严重:水体对光的吸收和散射导致图像模糊、光照不均甚至产生折射变形,极大地干扰了目标特征提取;2)高度外观相似:同种鱼类在纹理、颜色上几乎无法区分,一旦发生交错,跟踪器极易“认错”;3)高频遮挡:高密度养殖环境下,鱼群重叠现象频发,导致目标频繁丢失;4)非线性运动:不同于车辆的刚性运动,鱼类具有柔性形变和急转弯等突发性运动特征,导致传统运动模型失效。
针对上述挑战,本研究提出了一种尺度感知与无迹跟踪器(SU-T)。该框架创新性地引入了无迹卡尔曼滤波,有效解决了鱼类快速转向、非线性游动带来的轨迹预测偏差问题。同时,针对鱼类细长的身体结构,研究设计了FishIoU匹配机制,在计算重叠度时充分考虑了鱼体形态与尺度变化,显著降低了身份切换的发生率。实验结果显示,即便在鱼群高密度聚集、频繁相互遮挡以及快速游动的复杂场景下,SU-T依然能够保持目标身份的连续性与准确性,克服了传统方法中常见的轨迹断裂和身份跳变问题。

SU-T跟踪整体框架图
与现有算法相比,SU-T在MFT25基准上展现了卓越的性能。SU-T在HOTA、IDF1等多项核心指标上取得最优性能,证明了该方法在处理长时间序列跟踪任务时的鲁棒性与稳定性。

不同跟踪器在MFT25上的性能表现

SU-T与现有算法在MFT25上的性能对比
论文工作第一作者为信息与电气工程学院博士生李蔚然,通讯作者为李振波教授。团队研究生刘业强、郭倩男、魏弋杰以及新加坡国立大学Hwa Liang Leo教授参与了论文工作。该研究得到了北京市智慧农业创新团队项目(BAIC10-2025-E14)、中国农业大学国家数字渔业创新中心、农业农村部农业信息化标准化重点实验室、农业农村部智慧养殖技术重点实验室、农业农村部国家数字农产品流通(供应链与物流)创新分中心以及中国农业大学农业水资源高效利用全国重点实验室、2115国家数字渔业创新中心和智能养殖与饲料高效利用创新团队、国家留学基金委(编号:202406350102)的资助。
© 版权声明
本文由分享者转载或发布,内容仅供学习和交流,版权归原文作者所有。如有侵权,请留言联系更正或删除。

















水下监控终于能分清哪条鱼是谁了?
这SU‑T听起来挺牛的,感觉水下监控能省大事儿。