ECCV 2018 | 旷视科技夺获人工智能顶赛Wider Challenge人脸检测冠军

发布时间 2018年08月21日 07:39    编辑:landyliao    来源:旷视(Face++) 嘉人网 » 服饰

Wider Face and Pedestrian Challenge 2018(简称 Wider Challenge)是一项全球范围内的核算机视觉尖端赛事,旷视科技(Megvii)参战了其间人脸检测竞赛 Wider Face,终究以 0.5582 的成果技压群雄,勇夺人脸检测冠军。旷视科技人脸检测冠军纪录最早可追溯至 2013 年赢得人脸辨认范畴 3 项世界冠军。下面,本文将从竞赛、技能、团队以及工业 4 个维度打开解读。

Wider Face 竞赛成果。

关于 Wider Challenge

Wider Challenge 2018 是由核算机视觉顶会 ECCV 2018 举行的尖端应战赛之一,招引全球逾越 400 多支部队参与,竞赛及成果公布于 ECCV 会前完结,颁奖仪式及相关研讨会安排在大会期间(9 月 8 号)。继 FDDB 之后,Wider Challenge 成为核算机视觉检测范畴的基准竞赛,含金量很高,在必定程度上能够明晰反映参赛方技才能量的实况和沉积。

本年,该竞赛旨在处理人体检测范畴的 3 个中心问题:人脸的准确定位,人体的准确定位,以及人物身份准确匹配。为此,Wider Challenge 2018 相应地分为 3 个竞赛(track):WIDER Face, 方针是深掘新办法,改写人脸检测当时最佳水平。WIDER Pedestrian, 方针是搜集有用而高效的新办法,优化处理天然场景之下的行人检测问题。WIDER Person Search, 从 192 部电影中进行方针准确匹配的人物查找。

自左向右,三个竞赛的实例。

关于技能

从技能视点讲,这次的人脸检测竞赛 Wider Face 呈现了新难点,为此旷视科技给出了一套自己的处理方案,取得第一名的成果,逾越第二名微软(MSRA)2 个点。

难点

比较以往,WIDER Face 2018 有 2 个显着的难点。一是数据集,二是评价标准。

Wider Face 竞赛运用同名数据集,它初次开源于 CVPR 2016,包括 32,203 张图画和 393,703 个检测框标示,是当时不同场景之下人脸类别跨度最大的数据集,从小脸密布脸、多姿势脸、遮挡脸、表情脸、化装脸到含糊脸,一应俱全。

Wider Face 数据会集不同类别的人脸。

前人脸检测基准 FDDB 由于数据量小且简略退出之后,Wider Face 晋级为人脸检测范畴最科学、最威望的基准数据集,一起本年还进行了一些优化标示乃至是从头标示,堪称是人脸检测才能比拼的最佳渠道。清楚明晰,竞赛难度也加大许多。

Wider Face 2018 评价标准沿袭 COCO 标准,更详尽更严厉,对定位要求更高,不只要大约准,还要十分准,乃至是“反常准”。详细来讲,它不再只运用 AP_50,而是核算检测框 IoU 阈值逾越 10 的均匀精度,从 AP_50 到 AP_95(步长为 5,共 10 个 AP)进行加权求均匀值。这再次加大了竞赛夺冠的难度。

办法

鉴于上述两个新应战,旷视科技在技能沉积的根底上,从算法模型、Backbone 以及数据增强 3 个方面给出了原创性的处理方案。

旷视科技作为 COCO 冠军,在物体检测方面“家底”极厚,身经百战,构成了一套优异的“演练作战传统”。此次针对 Wider Face 人脸检测的小脸、含糊脸问题,旷视科技提出一种根据单阶段检测器的新办法,称之为级联检测网络(CascadeDetection Network)。

在 Backbone 以及数据增强方面,旷视相同做了新探究。比方 Backbone 避实就虚,没有挑选 ResNet 101,而是采样了像 DenseNet 121、 ResNet 50 这样相对轻量化的根底网络,或许多个轻模型的交融。旷视科技后续会针对性地出一篇论文,想了解更多的人请留心重视。

成果

通过上述原创技能,旷视科技竞赛成果优势显着,不只夺得第一名,成果还大幅逾越第二名、第三名,别离高出 2 个点和 5 个点。别的,旷视科技单模型和多模型成果都提交过,成果表明,即使是依照单模型,相同能够拿到冠军。

值得一提的是,旷视科技上层技能的立异源自底层技能和原创深度学习渠道的支撑。这次打赛过程中,旷视科技自研的深度学习云渠道 Brain++ 有力确保了模型练习的稳定性;原创的深度学习引擎(先于 TensorFlow)则确保高效快速地练习和测验模型,防止时耗。正是由于有后方的确保,才有前方的成功。

关于团队

打竞赛就像交兵相同,是一支部队,需求团队协作。可是旷视这次的竞赛,也只是动用了 1.5 名实习小矿工:一个为主,一个为辅(外加检测组担任人和研究员的辅导)。这种实习生冲在一线的打赛形式是一种训练和培育新人生长的宝贵机会。第一名的成果也反证了这种形式的科学性。

1.5 名实习生,这并不是说旷厂缺人,也不是小看打赛,这恰恰说明晰旷厂有一套齐备的“演练打赛机制”,不只节省了很多人力和时刻本钱,并且归入这套机制的每一方皆有所获。本质上这是一种高效的经历传承,实习生取得很多输入,再经由天分的脑瓜,输出第一名的成果,由此借假(竞赛)修真(才能提高),人与事两相成。

关于工业

人脸检测在旷视的整个核算机视觉技能矩阵中处于中层,归于中心算法之一,通过工程化包装或许硬件的加持,构成高效可仿制的模型结构,然后终究走向人脸相关的产品线。

人脸检测是机器视觉技能落地的最大场景之一,是旷视图画辨认技能的四大目标之一(人、脸、车、字),也是旷视 AI+IoT 战略中承上启下的一环。这一冠军成果所反映出的技能点立异将进一步优化旷视的整个技能系统,导向手机、安防、地产、零售等多个工业范畴,为达到 AI+IoT 战略供给了有力的技能支撑。

技术 科技 数据
最流行的:一周精选导览
最新Trends News
热点MOST POPULAR
lv