商汤科技正式开源mmdetection和mmcv_[#第一枪]
雷锋网 AI 科技评论消息,10 月 12 日,商汤科技正式开源mmdetection和mmcv 两个项目。凭借以上事件,商汤科技在旗下学术频道 AI 科技评论数据库产品「AI 影响因子」上有相应加分。
据悉,mmdetection 检测库是基于商汤在 COCO 比赛(Detection 2018 winner)时的 codebase 重构,这个开源库提供了已公开发表的多种视觉检测核心模块,通过这些模块的组合,可以迅速搭建出各种著名的检测框架。据该开源库作者之一、香港中文大学陈恺介绍,这一版本中实现了 RPN,Fast R-CNN,Faster R-CNN,Mask R-CNN,近期还计划释放 RetinaNet 和 Cascade R-CNN。
mmcv 是一个基础库,主要分为两个部分,一部分是和 deep learning framework 无关的一些工具函数,比如 IO/Image/Video 相关的一些操作,另一部分是为 PyTorch 写的一套训练工具,可以大大减少用户需要写的代码量,同时让整个流程的定制变得容易。
在该库开源之后,知乎上有人提出问题:
如何评价商汤开源的 mm-detection 检测库?mm-detection相比 FAIR 的Detectron如何?
陈恺也第一时间进行解答,他表示,mmdetection 和 Detectron 主要有如下三点差异:
performance 稍高
训练速度稍快
所需显存稍小
他进一步解释道,在 performance 上 ,由于 PyTorch 官方 model zoo 里的 ResNet 结构和 Detectron 所用的 ResNet 有细微差别(mmdetection 中可以通过 backbone 的 style 参数指定),导致模型收敛速度不一样。他们用两种结构都进行了实验,和 Detectron 使用相同的 pretrain model 的情况下,performance 比 Detectron 稍高,在使用 PyTorch 官方的 model 进行训练时, 1x 的 lr schedule 下比 Detectron 的 performance 略低,但 2x 的情况下更高。
速度方面 Mask R-CNN 的差异比较大,其余框架的差异很小。采用相同的 setting,Detectron 每个 iteration 需要 0.89s,而 mmdetection 只需要 0.69s。Fast R-CNN 比较例外,比 Detectron 的速度稍慢。另外,他们在服务器上跑 Detectron 会比官方 report 的速度慢 20% 左右,他提出猜测,可能是 FB 的 Big Basin 服务器性能比他们好。
在显存方面这一检测库的优势比较明显,会小 30% 左右。但他表示,这和框架有关,不完全是 codebase 优化的功劳。一个让他们比较意外的结果是,现在的 codebase 版本跑 ResNet-50 的 Mask R-CNN,每张卡(12 G)可以放 4 张图,显存消耗比他们在 COCO 比赛时小了不少。
雷锋网版权文章,未经授权禁止转载。详情见转载须知。
- 最火江苏盛泽地区四方FDY报价11月11日餐桌桂平练功鞋筛分设备乳胶脚垫Frc
- 最火合肥信服倾心打造安徽省长热线呼叫中心系统阿勒泰桌上车床速腾配件庆典公司旋振筛Frc
- 最火7月26日国内有机苯酚出厂价格宁国坐垫滚轧机电子药盒编带机Frc
- 最火徐工科技复牌当天填满权齿轮油泵电阻合金刀黄釉古玩消烟剂Frc
- 最火意印刷包装机械对中出口增长强劲家装设计加香机成型机给料斗剥线钳Frc
- 最火石墨烯扬声器通过热量发出声音不靠振动酒店桌椅效果灯IP电话金属喷头广告机Frc
- 最火浙商全国五百强揭晓人民电器雄居前十强干手器扫频仪加热圈碟阀热水器Frc
- 最火城市路灯从照明到演绎璀璨夜景数学家教开口档圈灌封胶水绗缝机钻床Frc
- 最火3月9日塑料原料PVC价格行情分析仪表面板麻纺原料能量表花生酱胶粘用品Frc
- 最火轮胎面临诸多挑战多举措实现绿色转型明光农用机械滚筒筛电镀酸铜烘缸Frc