> 正文

视觉技术四小龙迎来腾讯优图的挑战

2019-09-04 来源：DeepTech

深度学习让计算机视觉技术在过去几年的发展势如破竹，从实验室创新突破走向各行各业，计算机视觉赛道更成为明星AI企业一大聚集地。业界公认的“AI四小龙”（商汤、旷视、依图、云从）是其中的重要代表，冲在计算机视觉技术落地产业的第一线。

但实际上，诸如腾讯优图这样的团队，也同样动作连连，试图打造AI视觉技术落地产业的另一种范本。

外界认为，随着2018年的腾讯“930”整体战略升级+组织架构调整、明确铺开“消费互联网、产业互联网”之后，腾讯几大AI团队才开始兼顾技术研究和产业落地，但事实并非如此。

“我们从一开始就非常强调产品落地。优图最大的特点就是我们能做落地的研究，研究和落地结合得非常紧密”，腾讯优图实验室总经理吴运声在接受包括DeepTech在内的媒体采访时表示。

腾讯的视觉AI技术初期主要成长动力源于支撑腾讯的内部业务，也就是说，和一些AI创企不同的是，优图视觉AI技术的发展有比较明显的公司业务场景驱动的色彩。据了解，优图现已有超过15个行业解决方案，接入超过90项腾讯明星产品业务合作。

不过，尚不清楚优图研发的技术能给腾讯带来的业务上的具体经济效益，因为这些行业解方案往往是腾讯整体AI能力的打包，或涉及来自其他部门的支持。目前腾讯也并未给优图划定具体的营收指标，组织架构调整后，优图更多的是和腾讯云深度融合，打造各行各业的智能解决方案。

随着其技术持续在产业中验证，这支成立近7年的研发团队也有了细微的变化，例如所涉及的计算机视觉技术方向已经不再限于人脸识别，优图甚至还推出了一款针对各种场景的AI视觉模组VisionSeed，以期降低AI视觉产品的开发门槛。

整体解决方案仍是行业竞争重点

近日，优图在上海世界人工智能大会上宣布其在步态识别上的最新成果——提出“OGFN（Ordered Gait Fusion Network）算法”，可提升步态识别精度。

据吴运声介绍，对比已经被人们广泛知晓的人脸识别技术，步态识别通过捕捉人类行走模式进行身份识别，即使是在换装、换场景、面部遮挡等情境下，也可以准确识别，在刑侦安防、医疗康复等领域具备很强的应用性。具体到优图的最新步态识别进展上，该算法刷新了步态识别领域两大核心数据集CASIA-B数据集和OU-ISIR MVLP成绩，部分情景识别准确度提升11.3%。

另一个新的变化在于，腾讯优图联合英特尔发布了基于Movidius MyriadX芯片的AI视觉模组VisionSeed，内置了优图人脸识别算法，接入即可实现人脸检测、属性分析、姿态估计、人脸识别等功能，让普通开发者也可以探索其功能，DIY各种智能产品。通过不断开放软硬件技术能力，惠及更多的AI爱好者们。尽管VisionSeed这一AI视觉模组更多地定位在助力AI青年开发者上，但也反映出腾讯在输出AI视觉能力上正在做新的尝试。

对于在加速AI视觉技术落地产业上有何优势，吴运声分析，优图的优势更多在于结合腾讯云为客户打包完整的解决方案。

在介绍优图的优势时，他也点出目前AI落地产业的一大困境，即单独的算法突破很多时候对客户而言没有价值，客户需要的是能够帮助它解决具体问题的完整能力。“在算法层面上，大家都达到了比较高、也比较接近的水平”，他说。

因此，优图会与腾讯云、微信AI、腾讯AI Lab（后两者为腾讯的另两大AI研发团队）协同，结合自然语言处理、语音识别等视觉以外的AI技术，形成完整的解决方案，包括帮助客户梳理业务流程、提供配套的大数据分析业务等。至于技术链条后端的集成工作，腾讯会根据具体的案例选择合作伙伴作为集成方或者自己做。

技术之外，新业务场景还需新逻辑

据介绍，优图搭建了产学研用相结合的人才矩阵，在计算机视觉领域级别最高的研究会议CVPR上，仅2019年就有25篇论文被收录；此外，优图已拥有超过700

项专利技术，并形成了专利产出的完整链条。例如，优图自研的人脸识别技术支撑了腾讯在金融、安防、身份识别等领域的应用，如腾讯征信、微众银行和财付通、QQ、广点通等。

在工业领域的解决方案上，优图已经帮助国内面板大厂华星光电使用人工智能算法，对生产过程中器件图片进行智能缺陷分类与识别，并在面板智能质检上建立可复制型工业自动化排查系统；同时，在电网智能巡检场景中，协同无人机通过图像识别技术自动定位关键原件，对设备缺陷进行识别标注，比传统人工排查效率提升3倍。

整体来看，视觉AI落地规模化效应已经初步显现，预计今年中国市场规模将突破328亿元，无论是腾讯优图还是计算机视觉领域的其他玩家，市场空间仍然巨大，行业卡位战开始之前，更重要的是找到自身真正能够帮助实体经济发展的价值。

以AI赋能制造业为例，今年，不少行业人士指出该方向将是一个明显的新的行业爆发点，不少AI公司也在进行相关的业务布局。

不过，吴运声认为，在工业场景运用计算机技术的商业逻辑和C端运用人脸识别技术有非常大的不同。

“人脸识别算法有一定的技术门槛，可基于100个人开发出来的人脸算法，之后可以用到每一个人脸上进行试错迭代。但是，以面板检测为例，一个面板就有数百道工序，每个工序都不一样。做完了这道工序的模型，并不能直接用到第二道工序，第二道工序还需要从0开始，其中的工作量会非常大。

一方面要做不同的模型去适配解决不同工序的问题。另一方面不能靠堆人去实现它。

所以，工业场景还需要抽象去看行业技术上的共同点，能把行业整体共通的部分做出来，可以实现第一套工序开发模型一个月，第二套工序的时间可以缩短到二十天。

我们未来想法是打造一个平台，直接让客户按照我们的规则，可能自己就能训练模型。我们要做的是把这个门槛降低，这和人脸识别其实是两种不同的路径”，吴运声说。

所以如果您想报名少儿编程培训课程，就请点击“少儿编程报名”，填写信息，并领取5G的免费试听课程和学习资料。

关键词阅读

腾讯优图

视觉AI技术

关注我们的自媒体

获取更多精彩内容

编玩边学订阅号

编玩边学服务号

微博

编玩边学广东深圳

实用工具

资讯排行

回顾精彩，编程有你——编玩边学线下校区年终成果展示

【喜报】2020教育游戏作品大赛圆满落幕，玩学世界载誉而归！

第十一届蓝桥杯大赛成绩出炉！编玩边学学员战绩请查收！

教育部：编程教育将纳入中小学相关课程，赶紧看看别耽误孩子毕业

医疗智能机器人闪耀世界人工智能大会

人工智能能为我们做什么？竟然如此强大！

广东教育厅：AI培训一次收费不得超三千？

版权及免责声明

1、"编玩边学"上的内容，包括文章、资料、资讯等，本网注明"来源：编玩边学"的，其版权均为"编玩边学"或深圳市编玩边学教育科技有限公司所有，任何公司、媒体、网站或个人未经授权不得转载、链接、转贴或以其他方式使用。已经得到"编玩边学"许可的媒体、网站，在使用时必须注明"来源：编玩边学"，违者本网站将依法追究责任。

2、"编玩边学" 未注明"来源：编玩边学"的文章、资料、资讯等均为转载，本网站转载出于传递更多信息之目的，并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网站下载使用，必须保留本网站注明的"稿件来源"，并自负版权等法律责任。如擅自篡改为" 来源：编玩边学 " ，本网站将依法追究其法律责任。

3、如果本网所转载内容侵犯了您的权益，请与我们联系team@codepku.com，我们将及时处理。

扫描免费领取价值千元试听课

400-636-1878

证书查询 x

请输入证书编号：

请输入正确的证书编号

学员姓名：孙兴民

课程：Scratch Level 1

发证日期：2019.08.15

证书查询

编玩边学

资讯中心

行业动态

视觉技术四小龙迎来腾讯优图的挑战

腾讯优图

视觉AI技术

实用工具

资讯排行

最新资讯

独家首发：米切尔·雷斯尼克教授来华，或与编玩边学开展深入合作

编玩边学创始人郝祥林、李涛入选《2018胡润30×30创业领袖》榜单！

儿童兴趣班有哪些项目，该怎么选？

满载信赖，荣耀起航！编玩边学2019战略发布会圆满举办，全程高能回顾！

官宣！教育部公布「2020全国中小学生白名单赛事」，编程占一半！

人民日报统计：未来40年最吃香的3个专业，家有考生的快看看！

编玩边学：深圳少儿编程的发展现状怎么样？

《玩学世界》用户突破100万，“3D+游戏”发力教育生态效果惊人

用户隐私政策

人民日报：这9个好习惯，趁假期一定要让孩子养成，受益终身！

第十二届最后一场STEMA测评报名开始啦

4条编程学习小妙计，让你更好地教孩子学编程~

教育惩戒新规3月1日实施，划定7条红线明确惩戒尺度

【请查收】1月24日 STEMA评测线上考试指南！！！

教育部发布2021年寒假中小学生和幼儿护眼要诀，快收藏！

《玩学世界》用户突破100万，“3D+游戏”发力教育生态效果惊人

热门搜索

幼儿教学

人工智能

编程比赛编程竞赛小学生竞赛全国竞赛

深圳少儿编程，编玩边学少儿编程，少儿编程品牌