编玩边学

>

资讯中心

>

行业动态

> 正文

视觉技术四小龙迎来腾讯优图的挑战

2019-09-04 来源:DeepTech

深度学习让计算机视觉技术在过去几年的发展势如破竹,从实验室创新突破走向各行各业,计算机视觉赛道更成为明星AI企业一大聚集地。业界公认的“AI四小龙”(商汤、旷视、依图、云从)是其中的重要代表,冲在计算机视觉技术落地产业的第一线。

但实际上,诸如腾讯优图这样的团队,也同样动作连连,试图打造AI视觉技术落地产业的另一种范本。

外界认为,随着2018年的腾讯“930”整体战略升级+组织架构调整、明确铺开“消费互联网、产业互联网”之后,腾讯几大AI团队才开始兼顾技术研究和产业落地,但事实并非如此。

“我们从一开始就非常强调产品落地。优图最大的特点就是我们能做落地的研究,研究和落地结合得非常紧密”,腾讯优图实验室总经理吴运声在接受包括DeepTech在内的媒体采访时表示。

腾讯的视觉AI技术初期主要成长动力源于支撑腾讯的内部业务,也就是说,和一些AI创企不同的是,优图视觉AI技术的发展有比较明显的公司业务场景驱动的色彩。据了解,优图现已有超过15个行业解决方案,接入超过90项腾讯明星产品业务合作。

不过,尚不清楚优图研发的技术能给腾讯带来的业务上的具体经济效益,因为这些行业解方案往往是腾讯整体AI能力的打包,或涉及来自其他部门的支持。目前腾讯也并未给优图划定具体的营收指标,组织架构调整后,优图更多的是和腾讯云深度融合,打造各行各业的智能解决方案。

随着其技术持续在产业中验证,这支成立近7年的研发团队也有了细微的变化,例如所涉及的计算机视觉技术方向已经不再限于人脸识别,优图甚至还推出了一款针对各种场景的AI视觉模组VisionSeed,以期降低AI视觉产品的开发门槛。

整体解决方案仍是行业竞争重点

近日,优图在上海世界人工智能大会上宣布其在步态识别上的最新成果——提出“OGFN(Ordered Gait Fusion Network)算法”,可提升步态识别精度。

据吴运声介绍,对比已经被人们广泛知晓的人脸识别技术,步态识别通过捕捉人类行走模式进行身份识别,即使是在换装、换场景、面部遮挡等情境下,也可以准确识别,在刑侦安防、医疗康复等领域具备很强的应用性。具体到优图的最新步态识别进展上,该算法刷新了步态识别领域两大核心数据集CASIA-B数据集和OU-ISIR MVLP成绩,部分情景识别准确度提升11.3%。

另一个新的变化在于,腾讯优图联合英特尔发布了基于Movidius MyriadX芯片的AI视觉模组VisionSeed,内置了优图人脸识别算法,接入即可实现人脸检测、属性分析、姿态估计、人脸识别等功能,让普通开发者也可以探索其功能,DIY各种智能产品。通过不断开放软硬件技术能力,惠及更多的AI爱好者们。尽管VisionSeed这一AI视觉模组更多地定位在助力AI青年开发者上,但也反映出腾讯在输出AI视觉能力上正在做新的尝试。

对于在加速AI视觉技术落地产业上有何优势,吴运声分析,优图的优势更多在于结合腾讯云为客户打包完整的解决方案。

在介绍优图的优势时,他也点出目前AI落地产业的一大困境,即单独的算法突破很多时候对客户而言没有价值,客户需要的是能够帮助它解决具体问题的完整能力。“在算法层面上,大家都达到了比较高、也比较接近的水平”,他说。

因此,优图会与腾讯云、微信AI、腾讯AI Lab(后两者为腾讯的另两大AI研发团队)协同,结合自然语言处理、语音识别等视觉以外的AI技术,形成完整的解决方案,包括帮助客户梳理业务流程、提供配套的大数据分析业务等。至于技术链条后端的集成工作,腾讯会根据具体的案例选择合作伙伴作为集成方或者自己做。

技术之外,新业务场景还需新逻辑

据介绍,优图搭建了产学研用相结合的人才矩阵,在计算机视觉领域级别最高的研究会议CVPR上,仅2019年就有25篇论文被收录;此外,优图已拥有超过700

项专利技术,并形成了专利产出的完整链条。例如,优图自研的人脸识别技术支撑了腾讯在金融、安防、身份识别等领域的应用,如腾讯征信、微众银行和财付通、QQ、广点通等。

在工业领域的解决方案上,优图已经帮助国内面板大厂华星光电使用人工智能算法,对生产过程中器件图片进行智能缺陷分类与识别,并在面板智能质检上建立可复制型工业自动化排查系统;同时,在电网智能巡检场景中,协同无人机通过图像识别技术自动定位关键原件,对设备缺陷进行识别标注,比传统人工排查效率提升3倍。

整体来看,视觉AI落地规模化效应已经初步显现,预计今年中国市场规模将突破328亿元,无论是腾讯优图还是计算机视觉领域的其他玩家,市场空间仍然巨大,行业卡位战开始之前,更重要的是找到自身真正能够帮助实体经济发展的价值。

以AI赋能制造业为例,今年,不少行业人士指出该方向将是一个明显的新的行业爆发点,不少AI公司也在进行相关的业务布局。

不过,吴运声认为,在工业场景运用计算机技术的商业逻辑和C端运用人脸识别技术有非常大的不同。

“人脸识别算法有一定的技术门槛,可基于100个人开发出来的人脸算法,之后可以用到每一个人脸上进行试错迭代。但是,以面板检测为例,一个面板就有数百道工序,每个工序都不一样。做完了这道工序的模型,并不能直接用到第二道工序,第二道工序还需要从0开始,其中的工作量会非常大。

一方面要做不同的模型去适配解决不同工序的问题。另一方面不能靠堆人去实现它。

所以,工业场景还需要抽象去看行业技术上的共同点,能把行业整体共通的部分做出来,可以实现第一套工序开发模型一个月,第二套工序的时间可以缩短到二十天。

我们未来想法是打造一个平台,直接让客户按照我们的规则,可能自己就能训练模型。我们要做的是把这个门槛降低,这和人脸识别其实是两种不同的路径”,吴运声说。


所以如果您想报名少儿编程培训课程,就请点击“少儿编程报名”,填写信息,并领取5G的免费试听课程和学习资料。  

关键词阅读

腾讯优图

视觉AI技术

关注我们的自媒体

获取更多精彩内容

编玩边学-订阅号

编玩边学订阅号

编玩边学-服务号

编玩边学服务号

微博

编玩边学广东 深圳

版权及免责声明

1、"编玩边学"上的内容,包括文章、资料、资讯等,本网注明"来源:编玩边学"的,其版权均为"编玩边学"或深圳市编玩边学教育科技有限公司所有,任何公司、媒体、网站或个人未经授权不得转载、链接、转贴或以其他方式使用。已经得到"编玩边学"许可的媒体、网站,在使用时必须注明"来源:编玩边学",违者本网站将依法追究责任。

2、"编玩边学" 未注明"来源:编玩边学"的文章、资料、资讯等均为转载,本网站转载出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网站下载使用,必须保留本网站注明的"稿件来源",并自负版权等法律责任。如擅自篡改为" 来源:编玩边学 " ,本网站将依法追究其法律责任。

3、如果本网所转载内容侵犯了您的权益,请与我们联系team@codepku.com,我们将及时处理。

证书查询 x
请输入证书编号:

请输入正确的证书编号

学员姓名:孙兴民

课程:Scratch Level 1

发证日期:2019.08.15

证书查询

该证书不存在