容联“扩容” 走出AI视觉场景落地之路
AI席卷百业,作为AI时代的两个主要入口,智能语音产业已经进入爆发期,计算机视觉在新基建的推动下正在成为AI落地规模最大、应用最广的领域。
在语音和文本智能领域,无论是面向公有云市场的七陌云客服,还是面向大中型机构的容CC,容联一直在引领行业创新,构建了基于智能客服、智能联络中心的商业闭环。
在视觉领域,容联又是如何在原有能力上做延伸和商业化落地的?近日,CPS中安网对容联云通讯AI视觉解决方案总监陈开仡进行了采访,并关于通讯服务、AI技术、智能化视频监控等话题进行了交流与探讨。以下为访谈内容:
Q:容联云通讯的核心技术和产品优势主要集中在哪些方面?容联提出的视觉智能服务与传统视频监控的区别是哪些?
陈开仡:当语音和文本、视频智能化在通讯业务中的应用已经大量普及的时候,容联意识到当下市场对于图像识别具有大量的需求,因此容联开始了计算机视觉(CV)的调研和研发。
由于CV与NLP深度学习技术上具有相通性,并且容联拥有NLP引擎相关技术的积累,因此迅速掌握了CV场景的相关技术。
容联的优势在于针对特定场景的数据进行增强处理,将AI和传统技术结合,以及前沿技术工程化的能力。
比如说准确率,以智慧工地为例,容联的“慧眼”视觉分析平台可结合工地复杂现场做全方面检测,做安全帽佩戴检测时容联产品准确率可以超过90%。
AI算法极度依赖数据,但是很多情况下有效的数据采集又比较难,容联自有的数据增强处理技术可以在素材比较少的情况下获得比较好的效果。
深度学习技术十分依赖训练数据,且深度学习输出结果中一般都有“阈值”限制,实际应用中,很难设定适用于所有场景的统一阈值。
目前AI技术在落地过程中仍然受到数据量、数据质量、标注成本、数据域变化等问题的制约,单纯依靠深度学习模型难以解决复杂场景下的实际CV问题。
容联具备一系列针对实际应用场景的工程化优化手段,包括图像的时序分析机制、检测目标属性过滤机制、目标跟踪及ReID机制等,提高算法在落地应用时的精度。
除了技术上的壁垒,容联产品一个重要的壁垒还是其在行业中的积累,因为做某个行业的视频识别本质上就是还是拼行业数据的积累、以及对行业的理解力。实际操作中,准确洞悉行业痛点是一个周期很长且很重的事情。
另外关于视觉智能服务与传统视频监控的区别,传统技术的一般特点是通用性较强,容联提出的视觉智能服务结合深度学习后,可在传统视频监控的基础上,得到神经网络模型输出的具有语义信息的结果,在保持通用性的同时提升精度。
例如,目标跟踪场景,利用深度学习检测图像中特定种类物体位置,结合传统背景建模、帧差法、光流法等,达到通用性与专用性的平衡协调。
Q:容联 CV 的商业化落地聚焦在哪些行业?这些行业关注的重点是什么,解决了什么问题, 提升了什么价值?
陈开仡:目前容联聚焦的行业有智慧社区、加油站、化工、城管、卫监、明厨亮灶等行业,这些行业的重点各有不同。
以监控场景为例,50个摄像头,每天24小时,产生的视频量1200小时,一个月就是36000小时。即使监控岗位人员三班倒也无法做到100%覆盖,期间很容易漏过一些突发事件,事发后再去追溯会很困难。
再比如制造业工业产线场景,工人有规定的操作规范,规定的位置,通常会有监管人员进行监督。但是产线很长,又在不停运动,监管人员很难覆盖全部工位进行督导。产品因操作不当产生的瑕疵会直接影响用户评价,对企业造成不良的影响。
我们通过智慧视觉算法,对以上行业的关键场景进行智能的监管,提升了管理的效率、覆盖率,也提高了安全管控水平,同时降低了风险并且降低了监管成本。
Q:在这个市场上有做硬件的厂商,有做整体解决方案,有围绕最终用户的系统集成商,容联跟产业上下游的厂商的区别在哪里?有哪些合作?
陈开仡:容联采用的是AI能力+垂直行业+服务的模式,并且在多个领域都有大客户积累,善于深挖用户场景,发现痛点;单个用户的痛点可能是行业痛点,针对痛点进行定制化方案,将方案沉淀为行业方案,提升整体行业智能化水平是容联的目标。
另外容联的产品设计秉承松耦合原则,模块之间支持灵活的拆分重组,可以单独提供,或跟上下游厂商产品进行灵活融合,根据客户的需求进行方案的定制。
Q:了解到容联的视觉算法商城很丰富,现在还有正在挖掘的场景和算法,容联未来还关注到哪些是没有被开发的行业需求?是否可以简单谈一下未来趋势。
陈开仡:目前还有一些行业的需求还未被开发,例如卫监、教育、国土资源、军工、港务、物流等等。
关于未来趋势的预测从技术角度来讲:一个值得关注的未来趋势是从识别到理解,套用古人的说法就是从知其然到知其所以然。
过去十多年,计算机视觉在识别方面取得了显著的进展,但是现在仅仅进行识别远远不是我们所期望的,或者说只是迈出了智能化的第一步。
仅仅有结果对企业对行业的价值仍旧有限,可以对结果进行解释,价值会更大。把物体和物体,物体和环境的联系建立起来,有了这样的从基本属性到对象直至环境的关系,就有可能实现从知其然到知其所以然。
未来最重要的趋势就是从无需知识支撑的识别到需要知识支撑的理解,做到知识图谱的效果,或者可以称之为“计算机视觉图谱”。
从市场规模角度而言:目前计算机视觉行业增速持续保持较高的增长趋势,深度学习和卷积神经网络技术的推动着计算机视觉技术,同时也驱动着整个人工智能行业的迅速发展,计算机视觉技术已在各行各业有着举足轻重的作用。
伴随着技术成熟度提高,硬件性能的飞速提升,人脸识别、物体识别、工序识别、复杂场景识别等分类、分割算法不算提升精度,未来将有更多的场景能够应用计算机视觉技术,计算机视觉企业应在强化技术打造的前提下,发掘更多垂直领域需求,解决企业痛点。
Q:安防行业受智能化、信息化技术影响,边界逐渐模糊,泛安防成为行业未来趋势,众多巨头跨界入局,行业竞争加剧,容联面对如此激烈的市场格局,会如何应对?未来的战略和规划会做哪些调整?
陈开仡:泛安防时代,无论是技术还是市场,安防行业不再是一个封闭的行业。
首先是关于产品升级,容联将侧重于三个方面去创新:
第一,让安防从被动防范到主动预警,从“看”变为“做”;利用视觉智能把安防体系从被动的记录、检查,逐渐转变为自动剖析、主动预警或即时处置。
第二,让智能安防云端化。安防行业面对的一大问题就是场景“碎片化”,这是一个不可忽视问题,大量的碎片场景带来大量的数据积累,安防体系中存储的数据量级成指数增长,这时候应用会逐渐转向云端进行处理,将复杂任务云化,既可以增加处理效率,也可以合理的进行资源的分配,容联也会针对云端领域的应用场景做深入的研究。
第三,应用场景落地。安防行业已从前两年关注各类AI算法的功能和性能,转向重视算法与具体业务的匹配衔接,追求将AI性能落实到具体业务应用上,形成具体的解决方案。容联将致力于解决各种垂直应用场景。
同时随着5G、AI的兴起,外加政策的扶持,我们认为边缘场景将会为安防行业带来新鲜活力,所以云、边、端一体化也是我们一个重要的产品规划。
据悉,11月5日,「容联云通讯」宣布完成 1.25亿美元 F轮融资,由中国国有资本风险投资基金领投,新东方产业基金、Mirae Asset(未来资产)、蓝藤资本和CloudAlpha等战略及财务投资方共同参与。腾达资本、花旗环球金融亚洲有限公司和招商证券(香港)担任财务顾问。
这是国内云通讯领域迄今为止规模最大的一笔私募股权融资。
容联表示,本轮融资完成后,容联将进一步加大在智能通讯云服务方向的技术研发投入,提升产品厚度及竞争壁垒;同时持续创新,扩容边界,在5G、新基建的浪潮中,更好地助力企业和政府组织实现数字化改造与智能化升级,推动中国企业通讯市场变革。