网络
大三本科生领衔突破,自监督视频哈希技术刷新国际性能纪录
2025年2月27日,深圳——在短视频日均产量突破亿级的今天,哈尔滨工业大学(深圳)计算机科学与技术学院陈斌副教授课题组发布了一项颠覆性技术AutoSSVH(自动化自监督视频哈希框架),成功攻克海量视频检索的算力与精度瓶颈。该成果以第一作者连牛(大三本科生)和黎俊(大三本科生)、共同通讯作者陈斌副教授与清华大学王锦鹏博士为核心的研究团队完成,论文《AutoSSVH: Exploring Automated Frame Sampling for Efficient Self-Supervised Video Hashing》入选计算机视觉领域顶级会议CVPR-2025(录用率22.1%),标志着我国在视频智能分析领域取得重大突破。
一、技术内核:从“暴力计算”到“智能抽帧”的革命
传统视频哈希技术因均匀采样所有帧导致语义信息丢失严重,检索精度受限。AutoSSVH创新性地提出对抗式轻量化采样器,通过梯度翻转层(GRL)和Gumbel-Softmax方法,以可微分方式动态筛选重构难度高的关键帧。这种“以难促学”策略迫使模型聚焦复杂场景,使生成的哈希码更精准表征视频时空关联性。
图1:AutoSSVH的技术细节和核心创新点
性能跃升数据:
压缩效率:视频特征从高维向量压缩至16/32/64位二进制码,存储需求降至传统方案的1/1000;
检索精度:在UCF101数据集上实现89.7%的跨模态检索准确率,较国际最优方案提升36.5%;
训练速度:集成哈希投票算法优化对抗训练效率,模型收敛速度提升3倍,且哈希码邻域信息密度增加40%。
二、产业落地:从短视频到安防的全场景渗透
AutoSSVH技术已在多个领域引发连锁反应:
1. 短视频推荐:某些短视频等平台测试显示,哈希匹配速度提升66.7%,实时推荐响应时间缩短至毫秒级;
2.版权保护:通过哈希码快速比对,盗版视频识别准确率超95%,助力深圳市深侬信息科技有限公司版权风控系统;
3. 智能安防:华为智慧城市项目中,10万小时监控视频的异常事件检索效率提升8倍,误报率降低至2%以下。
陈斌副教授表示:“AutoSSVH不仅是算法创新,更是一次数据压缩范式的重构。我们正与头部企业合作,推动技术嵌入边缘计算设备,实现端侧实时视频分析。”
图2:连牛跟黎俊在探讨AutoSSVH论文的细节
三、团队故事:本科生主导的科研奇迹
连牛(第一作者)的成长轨迹堪称传奇:大二加入陈斌课题组,一年内以本科生身份发表CVPR一作、AAAI共一等顶会论文。其突破得益于课题组“早进团队、早定方向、早出成果”的培养模式。陈斌副教授强调:“科研需要敢于走出舒适区。连牛从零开始学习深度学习,仅用半年便掌握对抗生成网络的核心技术。”
课题组另一核心成员黎俊(大三本科生)在算法优化中提出关键思路:“我们将对抗训练与集成学习结合,解决了采样器与哈希码生成器的博弈失衡问题。”
四、国际反响:中国团队的“哈希风暴”
CVPR-2025审稿人评价:“AutoSSVH为视频哈希领域提供了全新的方法论框架,其可微分采样机制具有普适价值。”
未来展望:视频大模型的“哈希加速器”
团队正将AutoSSVH与多模态大模型结合,探索千亿参数模型的高效微调方案。陈斌副教授透露:“下一阶段目标是实现PB级视频库的秒级检索,并构建基于哈希的AI内容安全防火墙。”
(文 连牛;图/哈工大(深圳)提供)
【广告】免责声明:本内容为广告,相关素材由广告主提供,广告主对本广告内容的真实性负责。本网发布目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,广告内容仅供读者参考。
责编:
审核:张立花
责编:张立花