原标题:AI技术再寻突破口:多学科交叉与宽度学习
本报记者骆轶琪深圳报道
12月7日举行的2018大湾区机器人与人工智能大会上,多名业内人士表示,业界正在寻找打开当前深度神经网络架构的突破口。
12月11日,在接受21世纪经济报道记者的专访时,深醒科技创始人、首席科学家袁培江表示,依靠粗暴的数据驱动是有阈限的,当前深度学习的方法很快会遇到天花板。业界正在谋求算法数据可解释性、模型合理性的进一步探索。“技术永远是基于一定概率,目前的深度学习是一个不能解释的‘黑盒子’,人和机器面对同一个东西表现的特征,所得出的结果是不同的。”他解释道。
为此,越来越多的人开始挖掘深度神经网络架构之外的模式,中国自动化学会副理事长陈俊龙12月7日向记者介绍,今年初他提出一个新的架构:宽度学习系统的网络架构。按照目前的测试,其应用时耗费的神经元和所需速度是深度学习的“至少一半”。
在从机械性学习走向“认知”乃至学会“推理”、并能够掌握“思考方式”的过程中,人工智能技术将涉及更多学科和更深层次领域的交融。同时,与应用的结合仍是其不可或缺的一环。
突破算法“黑盒子”
袁培江向记者指出,理论上机器学习掌握了所有存储在其中的数据,就可以达到100%准确度,但目前尚未达到。“准确率从90%到99.99%会发展很快,但到小数点精确到更后面时,技术瓶颈会越来越明显。”他表示。
陈俊龙有同样的观点,他表示,“现在的人工智能是根据人设定和提供的架构来做,是机械智能。做到面部识别快速,算法快捷,是早期的基本AI应用。但对人的思维和动作认知,机器还没有这个能力。”
他认为,在认知和感知层面,AI目前仍面对很多困难,至少要10-20年的摸索。
再往后,更困难的是对脑科学方面的研究。这涉及研究人脑的思维机制,目标是教会机器学习和认识人类的思想。
在2018大湾区机器人与人工智能大会上,德国汉堡大学教授张建伟也提到,当前的弱人工智能更多是将数据自下至上地递进学习。下一步机器学习要融合其他强人工智能的学习方法,包括融入自上而下的知识、全局化地优化、进化算法实现可泛化的学习等。
因此,对深度神经网络架构逐渐显示出的技术迭代短板,令业内开始思考其他可替代性的架构模型。比如今年初,陈俊龙提出了宽度网络架构。
他向21世纪经济报道记者解释道,宽度学习和深度学习网络架构,本质上是结构和算法的差别。据介绍,深度神经网络学习架构,是在结构固定以后才开始学习。那么此后学习期间如果出现不准确,就要重新设计网络、再学习一次。
宽度则是设计好网络后,当面临学习不准确的情况,可以随时以横向的方式进行增量扩充,即通过增加神经元,以提高准确度。
袁培江则强调,当前业界一种观点是,不能单纯做“黑盒子”,“我们会追求,对机器做出的判断这个过程既能够做得对,也能够说得清。这可能是一个发展的必然过程。”他向记者指出,接下来将探讨的方向包括,对于数据的可解释性,模型的合理性,将先验知识或者知识图库的结合等方面。否则深度学习模型很快会遇到天花板。举例来说,在医疗领域,很多种类的癌症识别率已经可以达到98%。但为什么达到这个水平并不知道,同时不同病种结果不同,所以要找到机器学习的机制,做好迁移学习;另外要摸清为什么能够做到这样的识别率。
智能2.0时代的应用
科研技术和行业应用落地永远是相辅相成的角色,在AI领域尤其如此。通过将往期应用经验交给机器学习,可以一定程度提升机器的识别效率和准确度。
图灵机器人董事长俞志晨12月11日向记者分析道,随着技术的深化,应用方面正走在智能2.0向3.0进化的阶段。
他指出,智能1.0时代更多表现在语音交互方式层面提供服务,在2.0时代将对语义理解有更大要求,并与视觉交互相融合。“现在我们对多模态交互方式的要求越来越高,至少每2-3年会有一个新阶段的跨越。”
作为初创企业,图灵机器人的技术发展策略就是深挖一个主场景,即儿童市场。
“我们发现一些近年比较火的基于软件的聊天机器人,在基础技术服务上已经出现发展瓶颈,现在的创新更多是在内容生成等层面,而不是底层技术。”俞志晨认为,儿童场景将高度依赖软硬件的结合,其发展空间会比纯互联网产品前景更宽。
袁培江也向记者强调,创业企业首先讲求的是AI场景落地,即保持产业化的“火种”,此后当大量从业者涌入这个行业时,就要及时意识到发展的瓶颈在哪里。若无法持续解决痛点,产业迟早会陷入与如今VR行业同样的困境中。为此,深醒科技的策略是寻求更多合作落地,包括技术和应用两个层面。
陈俊龙告诉记者,从目前的实验来看,其研究的宽度学习落地到应用中,与深度学习可以落地的应用场景并无差别。但由于宽度学习的增量学习速度加快,在同样准确度条件下,宽度学习架构的资源消耗(包括时间、神经元所需数目等)是深度学习的至少一半。
“中国在AI应用上在世界范围内是绝对领先,但基础科学的早期算法都是源自国外的开源。这种情况下,我们是否能基于之前学过的东西,形成一套更重要的理论很重要。宽度学习只是其中一个算法学习。”陈俊龙如此指出。