AI技术再寻突破口：多学科交叉与宽度学习

2018-12-12 | 浏览：

原标题：AI技术再寻突破口：多学科交叉与宽度学习

本报记者骆轶琪深圳报道

12月7日举行的2018大湾区机器人与人工智能大会上，多名业内人士表示，业界正在寻找打开当前深度神经网络架构的突破口。

12月11日，在接受21世纪经济报道记者的专访时，深醒科技创始人、首席科学家袁培江表示，依靠粗暴的数据驱动是有阈限的，当前深度学习的方法很快会遇到天花板。业界正在谋求算法数据可解释性、模型合理性的进一步探索。“技术永远是基于一定概率，目前的深度学习是一个不能解释的‘黑盒子’，人和机器面对同一个东西表现的特征，所得出的结果是不同的。”他解释道。

为此，越来越多的人开始挖掘深度神经网络架构之外的模式，中国自动化学会副理事长陈俊龙12月7日向记者介绍，今年初他提出一个新的架构：宽度学习系统的网络架构。按照目前的测试，其应用时耗费的神经元和所需速度是深度学习的“至少一半”。

在从机械性学习走向“认知”乃至学会“推理”、并能够掌握“思考方式”的过程中，人工智能技术将涉及更多学科和更深层次领域的交融。同时，与应用的结合仍是其不可或缺的一环。

突破算法“黑盒子”

袁培江向记者指出，理论上机器学习掌握了所有存储在其中的数据，就可以达到100%准确度，但目前尚未达到。“准确率从90%到99.99%会发展很快，但到小数点精确到更后面时，技术瓶颈会越来越明显。”他表示。

陈俊龙有同样的观点，他表示，“现在的人工智能是根据人设定和提供的架构来做，是机械智能。做到面部识别快速，算法快捷，是早期的基本AI应用。但对人的思维和动作认知，机器还没有这个能力。”

他认为，在认知和感知层面，AI目前仍面对很多困难，至少要10-20年的摸索。

再往后，更困难的是对脑科学方面的研究。这涉及研究人脑的思维机制，目标是教会机器学习和认识人类的思想。

在2018大湾区机器人与人工智能大会上，德国汉堡大学教授张建伟也提到，当前的弱人工智能更多是将数据自下至上地递进学习。下一步机器学习要融合其他强人工智能的学习方法，包括融入自上而下的知识、全局化地优化、进化算法实现可泛化的学习等。

因此，对深度神经网络架构逐渐显示出的技术迭代短板，令业内开始思考其他可替代性的架构模型。比如今年初，陈俊龙提出了宽度网络架构。

他向21世纪经济报道记者解释道，宽度学习和深度学习网络架构，本质上是结构和算法的差别。据介绍，深度神经网络学习架构，是在结构固定以后才开始学习。那么此后学习期间如果出现不准确，就要重新设计网络、再学习一次。

宽度则是设计好网络后，当面临学习不准确的情况，可以随时以横向的方式进行增量扩充，即通过增加神经元，以提高准确度。

袁培江则强调，当前业界一种观点是，不能单纯做“黑盒子”，“我们会追求，对机器做出的判断这个过程既能够做得对，也能够说得清。这可能是一个发展的必然过程。”他向记者指出，接下来将探讨的方向包括，对于数据的可解释性，模型的合理性，将先验知识或者知识图库的结合等方面。否则深度学习模型很快会遇到天花板。举例来说，在医疗领域，很多种类的癌症识别率已经可以达到98%。但为什么达到这个水平并不知道，同时不同病种结果不同，所以要找到机器学习的机制，做好迁移学习；另外要摸清为什么能够做到这样的识别率。

智能2.0时代的应用

科研技术和行业应用落地永远是相辅相成的角色，在AI领域尤其如此。通过将往期应用经验交给机器学习，可以一定程度提升机器的识别效率和准确度。

图灵机器人董事长俞志晨12月11日向记者分析道，随着技术的深化，应用方面正走在智能2.0向3.0进化的阶段。

他指出，智能1.0时代更多表现在语音交互方式层面提供服务，在2.0时代将对语义理解有更大要求，并与视觉交互相融合。“现在我们对多模态交互方式的要求越来越高，至少每2-3年会有一个新阶段的跨越。”

作为初创企业，图灵机器人的技术发展策略就是深挖一个主场景，即儿童市场。

“我们发现一些近年比较火的基于软件的聊天机器人，在基础技术服务上已经出现发展瓶颈，现在的创新更多是在内容生成等层面，而不是底层技术。”俞志晨认为，儿童场景将高度依赖软硬件的结合，其发展空间会比纯互联网产品前景更宽。

袁培江也向记者强调，创业企业首先讲求的是AI场景落地，即保持产业化的“火种”，此后当大量从业者涌入这个行业时，就要及时意识到发展的瓶颈在哪里。若无法持续解决痛点，产业迟早会陷入与如今VR行业同样的困境中。为此，深醒科技的策略是寻求更多合作落地，包括技术和应用两个层面。

陈俊龙告诉记者，从目前的实验来看，其研究的宽度学习落地到应用中，与深度学习可以落地的应用场景并无差别。但由于宽度学习的增量学习速度加快，在同样准确度条件下，宽度学习架构的资源消耗（包括时间、神经元所需数目等）是深度学习的至少一半。

“中国在AI应用上在世界范围内是绝对领先，但基础科学的早期算法都是源自国外的开源。这种情况下，我们是否能基于之前学过的东西，形成一套更重要的理论很重要。宽度学习只是其中一个算法学习。”陈俊龙如此指出。

TAGS：多学科突破口交叉