当(dāng)前,以(yǐ)深度学(xué)习为代表的人工智能技术已经应用到各(gè)个行业。驱动人工智能技术蓬勃(bó)发展的(de)是各(gè)行各业积累的大数据(jù)。可以说,正是在大数据的“喂养”下(xià),人工(gōng)智能技术才(cái)真正茁壮成长。
然(rán)而,在近日(rì)召开的(de)香(xiāng)山科学会议第667次学(xué)术讨论会上,与会(huì)专(zhuān)家指出,大数据(jù)的“红利”效应正在逐(zhú)渐减弱,人工智能(néng)技术的单(dān)点突破难以(yǐ)持(chí)续支撑行(háng)业发展,亟须在(zài)数据科学和(hé)计算智能方面突破一些关(guān)键核(hé)心技术。
主流AI算法未充分考虑大数据复杂性
人们常常用海量性、多样性、高速以及价值密(mì)度低来描(miáo)述大数据的特点。但真实的大数据往往更加复杂,比如具(jù)有不完全(quán)性、不确定性、动态性、关(guān)联性等特点。反观经(jīng)典(diǎn)的人工智能算法,它们(men)对(duì)数据的(de)假设往往过于(yú)简单。比如,假(jiǎ)设(shè)数据是静态的,产生于独立(lì)同分布的采样过程;训练数据是可靠的、数据(jù)所承(chéng)载的信息是完全的(de)等。
“数(shù)据的真实复(fù)杂(zá)性和(hé)算法的简单(dān)假设之间存在着巨大鸿沟,这使得经典智能算法在(zài)很(hěn)多(duō)复杂(zá)任务上表(biǎo)现欠佳,亟待进一(yī)步的研究和探索。”会议(yì)执行主席(xí)之一、中国科学院院(yuàn)士梅宏(hóng)强调(diào),大数据(jù)是人工智(zhì)能获得成功的物质(zhì)基础(chǔ),但目前主流的人工(gōng)智能算法并未充分考虑大数据本(běn)身的(de)复杂性。
从计算(suàn)和(hé)通信(xìn)领(lǐng)域(yù)看,大数据与人工智能技术在大规模工程(chéng)化应用方面(miàn)取(qǔ)得了(le)长足进步。然而,大数据处理的技术进(jìn)步主(zhǔ)要体现在:以软硬(yìng)件(jiàn)垂直优化和体(tǐ)系重构的极端化方式来适应数据规模(mó)、传(chuán)输带宽和处理速度的(de)提(tí)升,研究人(rén)员(yuán)对(duì)大数(shù)据(jù)固有(yǒu)的非确定性和复杂(zá)性尚没有深刻认识;与此同时,人工智能技术(shù)也面临鲁棒性(xìng)、可解释性和复杂系统认(rèn)知瓶颈等(děng)挑(tiāo)战。
梅宏进一步指出(chū),当前数据(jù)智(zhì)能存在低效(xiào)、不(bú)通用以及不(bú)透明三大问(wèn)题。“现在的数据智(zhì)能(néng)就像(xiàng)工业(yè)革命前的‘蒸汽机(jī)原型’一样,低效而昂(áng)贵(guì);它只(zhī)能针对不同应用定制不(bú)同模型,难以建立通用模(mó)型。”梅宏(hóng)说,更重要的是,当前并没有对(duì)数据智能形(xíng)成深刻认识,只(zhī)是知其然(rán),而不知(zhī)其所以(yǐ)然。
人机融合或可弥补数据自动推理弱点
在中国科学院自动化研究所研究员(yuán)陶建华看来,虽然当前人工智(zhì)能在数据自动推理中依然面临很(hěn)多技术难(nán)点,但是人机融合的推理方式(shì)可以有效地弥补这(zhè)些弱点。人机融合(hé)推理着重于(yú)研(yán)究一种(zhǒng)由人(rén)和机器相互(hù)协作下的新的推理模式,包含“机器懂人(rén)”和(hé)“人懂机器”两方面的含义。
对人的推理思维的理解是(shì)“机器懂人(rén)”的关键。其核心问题是如何(hé)构建能够反映(yìng)人推理过程的(de)思维(wéi)形式化计算方法。该方(fāng)法将人的推理思维形式化描述、概率推(tuī)理、构建(jiàn)知识(shí)图(tú)谱,以(yǐ)及(jí)与现(xiàn)实场(chǎng)景的信息进行(háng)有机融合,从而可以将人(rén)的推理(lǐ)过程有效(xiào)的输入到(dào)机(jī)器中,并与(yǔ)机器的推理网络进行结合。
此(cǐ)外,解决(jué)“人懂(dǒng)机器”问题(tí)将有助于人(rén)对(duì)机器智能辅助增强(qiáng)。机器推理(lǐ)过程的可解释性(xìng),对于构建人机融合的(de)推理过(guò)程(chéng)尤为关键。过程(chéng)可解(jiě)释的机器推理方法(fǎ)提(tí)供了解决问题(tí)的新(xīn)方法,适当的扩展流程,并(bìng)最大限度地(dì)减少人为错误的机会(huì),可以帮助人类和机器协同做出更为准确和迅速(sù)的推理与判断。
微软(ruǎn)亚洲研究院副(fù)院长(zhǎng)刘铁岩结合他们的实际工作举(jǔ)例(lì)道:“我们(men)在(zài)深度强化学习的基础上,利(lì)用(yòng)‘完美(měi)教练’技术来处理信(xìn)息的不完全和不确定性,从而很好地(dì)解决了麻将这(zhè)一复(fù)杂的博(bó)弈问题。我们(men)的算法(fǎ)在2019年3月登陆知名的竞技麻将平(píng)台,经过5000局的(de)鏖战,成(chéng)功晋级十段,其稳定段(duàn)位显著超越人类顶级选手,成为首个超(chāo)人麻将AI。”这(zhè)是在处(chù)理数据不完全性(xìng)和不确定性方面做出的有益尝试。
刘铁(tiě)岩指出,大(dà)数据特性在不断演化,且愈发复杂(zá)。新型(xíng)智能(néng)算(suàn)法(fǎ)需要针(zhēn)对数据特点(diǎn)有的放矢地解决问题(tí),这样才能填补数据与算法间的(de)鸿沟,使人工智能绽(zhàn)放更多的价(jià)值。