阿里AI视频识别算法新突破：可帧级解读视频

2018-9-14 21:03| 发布者: | 查看: 100| 评论: 0

摘要: 　　手机里存了大量的视频，想剪辑其中的精彩片段却犹如大海捞针？视频网站拥有海量视频，如何严格审核避免问题发生？　　近日，在德国慕尼黑举办的计算机视觉国际顶会 ECCV（European Conference on Computer Visio ...

　　手机里存了大量的视频，想剪辑其中的精彩片段却犹如大海捞针？视频网站拥有海量视频，如何严格审核避免问题发生？

　　近日，在德国慕尼黑举办的计算机视觉国际顶会 ECCV（European Conference on Computer Vision）上，阿里安全图灵实验室高级算法专家析策展示了最新的 AI 视频识别算法，其识别精度超越目前主流方法，有效提升了视频自动标签的行业精度，这一新算法已被 ECCV 收录。

　　阿里安全图灵实验室高级算法专家析策表示，为提升 AI 技术在实际场景中针对视频识别的精度，提出一种新的基于图（Graph）的视频建模方法，能表达含有复杂事件内容的长视频。

　　析策表示，这一方法的主要思路是通过“深度卷积图神经网络”（下称“DCGN”）对视频的帧、镜头、事件进行多级的建模，逐渐地从帧级、镜头级，一直到视频级进行抽象，从而获得视频全局的表达，进而进行分类。

　　他举例称，“比如一段美食节目视频中，包含厨师长、主持人聊天、食物、观众等内容，AI 在学习视频内容时会先根据内容对视频进行逐帧的语义表达，形成特征序列，用不用的标签进行打标，随后在通过多层次的网络对这些不同打标的内容进行关系表达，深度理解这些内容之间的关联度，将相似的节点衔接起来，最终组合出对整个视频的理解。”

阿里 AI 视频识别算法新突破：可帧级解读视频