原标题:专注前端成像“疑难杂症”,他们让机器“看”得更清
随着机器视觉技术的发展,越来越多的人脸识别闸机出现在生活中。但你是否遇到过这种尴尬情况:因为中午阳光太强或者晚上光线太弱,机器无法识别你的脸?
因为复杂光线而导致机器无法正常识别的情况还发生在自动驾驶、机器人、工业检测等领域。
2014年,随着深度学习的重大突破,AI人脸识别准确率首次超过人眼识别准确率这条工业红线,这意味着人脸识别已经达到工业化落地的水平。但实际上,这一准确率大多是在实验室条件下实现的,在现实环境中,由于复杂光线条件等影响,图像源成像效果往往并不理想,继而也会影响到图像识别准确率。
眼擎科技要解决的就是前端成像这一痛点。眼擎科技专注于机器视觉前端成像技术,解决复杂光线导致的成像品质不稳定问题。其创始人朱继志将他们要做的事情形容为“解决AI视觉落地的最后一公里”。
朱继志毕业于北京大学电子学系,曾任职于中兴视频通讯部,随后在国内最大的芯片分销商担任VP,在图像领域有20年左右经验。4年前,朱继志觉察到机器视觉领域高品质图像(视频)将会成为刚需,决定成立眼擎科技,专注于研发高品质视觉成像引擎技术及芯片。
经过4年研发,眼擎科技先后发布了解决复杂光线的eyemore X42专用成像芯片,无人驾驶/辅助驾驶视觉专用解决方案 eyemore DX120,“驯光者”系列相机以及新一代安防专用逆光相机IMX385。
目前,眼擎科技正在进行A轮融资,截至2018年9月,眼擎科技已完成design-in客户近百家。
解决复杂光线下的成像难题
寻找中国创客:目前机器视觉落地主要面临的痛点是什么?
朱继志:图像技术分两大块,一块是前端图像采集,另一块是后端图像识别、处理。这几年图像识别的算法发展非常快,越来越成熟,但是在摄像头前端的视觉采集方面,受限于传统的基础设施,技术还跟不上。
前端的采集设备有一个最大的问题,就是对环境光线的适应能力太差,导致在落地部署的过程当中,前端的图像源成像效果差,后端的AI图像识别率大受影响。
寻找中国创客:有什么具体落地过程中的例子吗?
朱继志:最简单的例子就是人脸闸机。现在AI领域一个典型场景就是刷脸进门,在这种场景下,摄像头装在室内还好一点,如果是在进会场、小区大门的场景,室外光线是不确定的,光线的不确定性导致摄像机在逆光、暗光等条件下成像质量较差,比如输出全白或全黑的图片,这样后端AI图像识别就不能正常运作。
其实核心问题,就是要解决AI视觉在落地时的现场环境适应能力的问题,我们称之为解决“AI落地的最后一公里”。
寻找中国创客:针对AI视觉落地环境适应问题,眼擎科技提出了什么解决方案?主要是从硬件层面还是算法层面解决问题?
朱继志:我们推出的产品主要是 “eyemore成像引擎”,核心就是要解决逆光的问题。感光问题在技术上来讲叫做“动态范围”,传统的摄像机的动态范围都远远不够。
决定动态范围的包括镜头、CMOS、ISP成像处理三个环节。眼擎科技专注于“ISP成像”环节,打造包括算法、算力和数据在内的全新成像技术架构,也就是“成像引擎”。我们通过积累丰富的数据、优化数十倍算法、大规模提升算力,从而提高传统摄像机ISP的动态范围,在逆光环境下得到更清晰的成像效果。
寻找中国创客:eyemore成像引擎可以将成像效果提升多少?
朱继志:暗光能力比人眼高 8 倍,降噪能力比传统摄像头高 64 倍,逆光能力比传统摄像头高 32 倍。
面向自动驾驶、安防、工业检测等几大市场
寻找中国创客:对于成像效果来说,最重要的感光元器件是CMOS,其感光面积对画质有决定性作用。是不是直接用效果更好的CMOS,对成像效果的作用更大?
朱继志:这涉及产业分工问题。对于成像效果来说,镜头、CMOS、ISP成像处理各占一定权重。我们的优势是在前两个条件相同的情况下,可以做到更好的成像效果。而且CMOS跟芯片一样,核心技术掌握在少数厂家手中,中国还无法量产。
寻找中国创客:eyemore成像引擎主要是通过算法+算力+数据的方式提高成像效果,那么这个环节能否后移,在图像识别环节通过算法提高成像效果?
朱继志:因为现在后端AI图像识别的算力非常强,可以对成像效果做出很大补偿。但是一方面,前端成像做得好可以为后端省下很多计算资源,更加直接;另一方面,并不是每一个做后端图像识别的公司都有做好成像的能力。两方面作用下,在前端做好成像,是一个更优、更直接的选择。
寻找中国创客:眼擎科技的目标市场包括哪些?
朱继志:包括自动驾驶、安防、医疗、机器人、工业检测、3D等领域。2018年4月,我们推出了面向无人驾驶/辅助驾驶视觉专用解决方案 eyemore DX120,使自动驾驶/辅助驾驶视觉达到120dB 的宽动态能力,超越了人眼的感知能力。
寻找中国创客:就自动驾驶而言,摄像头并不是唯一的传感器,使用毫米波雷达,是不是就可以弥补摄像头逆光感知差的问题?
朱继志:我们认为未来自动驾驶传感器肯定是以摄像头为主、激光雷达为辅。一方面,摄像头成本更低、适用范围更广;另一方面,在识别红绿灯等场景下,摄像头具有不可替代的作用。
筑起技术壁垒,已design-in近百家客户
寻找中国创客:跟其他竞品相比,眼擎科技的核心壁垒是什么?
朱继志:首先,我们提前布局,具有先发优势。眼擎科技成立于2014年,已经在研发方面投入了4年,在各种落地场景进行过测试,积累了大量数据。我们不能说其他公司做不出类似产品,但是他们要达到同样的测试量,起码需要两年。
其次,眼擎团队在图像、芯片等领域积累深厚。我本人毕业于北大电子系,曾任中兴通讯视频开发工程师,在图像视频技术及产品领域有10年的丰富经验。2006年又加入国内最大的芯片分销服务商科通集团,后任科通集团副总裁,在包括手机、汽车、网络、工业等各行业的芯片推广有8年的丰富管理经验。我们CTO是我在中兴的同事,也是相关领域博士。我们的团队在光学、算法、硬件等方面有一定经验。
寻找中国创客:眼擎科技有多少客户?
朱继志:我们是一家慢公司,前三年专注于技术研发,2018年开始商业化推广。目前,我们已完成design-in客户近百家,也就是说我们正基于这些客户的产品给出方案,并达成一些合作。
寻找中国创客:目前融资情况如何?
朱继志:我们的A轮融资正在进行中。
新京报记者 蔡浩爽 编辑 苏琦 校对 李立军