在全球(qiú)抗击新冠肺炎(Covid-19)疫(yì)情(qíng)方面,各种各样的高新科技都(dōu)有望“大显(xiǎn)身手”,其中最突出的是(shì)自然语言处理技术。无论是(shì)在抗疫一线,还(hái)是在社区(qū)管控、疫苗研发等大后方,自然(rán)语言处理技术发挥的作(zuò)用(yòng)都不可忽视。目前世界上有(yǒu)多个研究团队(duì)使用(yòng)该(gāi)技术抗击新冠疫情,并取(qǔ)得了可喜的成(chéng)果。
在(zài)新冠疫情中,最早(zǎo)正式(shì)发出疫情警告的并不(bú)是(shì)世界卫生组织或美国疾控中心,而是加(jiā)拿大一家(jiā)名为“蓝点”(BlueDot)的健康监(jiān)测平台;它早在2019年12月31日(rì)就向其客户发出了提前疫情警告(gào),避开危险区(qū)域。该平台设计(jì)了疾病(bìng)监(jiān)测分(fèn)析程序,使用自然语言处理技术来筛选65种语言的新闻报道(dào),以及(jí)航空公(gōng)司数(shù)据和动物疾(jí)病(bìng)暴(bào)发的报道(dào),在(zài)疫情暴发之(zhī)初(chū)发挥了监测功能。
前不久,美国艾伦人工智能(néng)研究所发布了“新冠(guàn)肺炎开放研(yán)究(jiū)数据(jù)集”(CORD-19)的资源管理器以及(jí)全文本(běn)搜索引擎,并表示希望(wàng)它可以(yǐ)帮助人们探索数据(jù)集并确定潜在的研究成果(guǒ)。该(gāi)机构语言学家道格·雷蒙(méng)德博士说:“过去几年,我们在自然语言处理方面取得了长足进(jìn)步,CORD-19这类数据集的实用性(xìng)可能会比几年前更大,因(yīn)为现在(zài)我们(men)有了(le)更多可用的工(gōng)具。”
美国政府(fǔ)曾经(jīng)宣(xuān)布联合艾伦人(rén)工智能(néng)研究所、微(wēi)软研究院、美国国立卫生研究院(yuàn)等机构共同发(fā)布有关新冠(guàn)疫情的学术(shù)文献的开放研究数(shù)据集CORD-19,并呼吁世界各地的人(rén)工智能(néng)专家(jiā)采取行动,开发新的文本和数(shù)据挖(wā)掘技术,以(yǐ)帮助(zhù)科(kē)学界回答与新冠(guàn)疫情相关的高优先(xiān)级科学问题。其目的(de)是为(wéi)医学和自然语言(yán)处理研究人员发(fā)布疫情数据(jù)集,以获(huò)得有助于对抗此次疫情的真知灼见。
美国哈(hā)佛(fó)大(dà)学医学院的研(yán)究人员借助(zhù)自然语言处理技术最近开发出(chū)了一种(zhǒng)工具(jù),可以评估新冠患者的病例、社交媒体和健康卫生数据。他们率先努力通(tōng)过使用机器学习和大数(shù)据分析查看来自各种来源的数据(jù)和信息来寻找(zhǎo)新冠病毒的(de)解(jiě)决方案(àn)。借(jiè)助自(zì)然语(yǔ)言处理(lǐ)工(gōng)具,他们(men)还可(kě)以搜(sōu)索有关新(xīn)冠病(bìng)毒(dú)的在(zài)线信息(xī),并了解爆发(fā)的当前位置。
中国疾病预防控制中(zhōng)心(xīn)的研究人(rén)员最近在使(shǐ)用科技巨头阿里(lǐ)巴巴达摩院的自然语言(yán)处理技(jì)术开展病(bìng)历文本(běn)分析和流行病学调查工作(zuò),并取得了阶段性成果。达摩院的研究团队通过自(zì)然语言处理回顾性数据(jù)、使用卷积神经网(wǎng)络训练CT影像的识(shí)别系统,它(tā)可以快速鉴别新(xīn)冠影像与普通(tōng)病毒性肺(fèi)炎影像的区别,最终识别准确率高达 96%。
智能(néng)问诊系统能够在线为病患提供问诊服务,其使(shǐ)用应用语义(yì)理(lǐ)解、情感分析等(děng)自然语言处理技术,通过问题预判、意图反(fǎn)问、分类识别、相似度匹配等方法,不仅能够解答何(hé)种情况需要就(jiù)医,还能实现疫情防控(kòng)动态进展、科学防护知识、谣(yáo)言鉴别(bié)等(děng)问题精(jīng)准解答,并支持人机协作、自主(zhǔ)学习、会话引导等(děng)功能(néng)。
在疫情防(fáng)控期间(jiān),中国百度灵医智惠(huì)推出的“智(zhì)能(néng)咨询(xún)助手”,包含新冠问(wèn)题解答、标准化预问(wèn)诊路径、在线医生咨(zī)询(xún)辅助三大模块;它通(tōng)过自然语言处理技术赋能(néng)在线健(jiàn)康(kāng)咨询平台(tái)、政府疫情防控平台、互联网医院等第三(sān)方平台,助力其直接为公众提(tí)供有关(guān)新冠的在线科普、在线咨询,倍数(shù)级(jí)提升效率。
疫情发(fā)生至今,情况愈演(yǎn)愈烈,人们一(yī)边(biān)要(yào)提防新冠肺炎(yán)的传染,一边又要(yào)不断接受着海量(liàng)的真假难(nán)辨的信息的轰炸。但对于(yú)后者(zhě),自然语言处理技(jì)术能够帮助人们提取(qǔ)信息的主要观(guān)点,识别文章(zhāng)情(qíng)绪甚至分(fèn)析文章的(de)可信(xìn)度;这在(zài)抗疫信(xìn)息战中将“谣言”粉碎(suì),促进(jìn)舆论生态良性循环(huán),从(cóng)而为抗疫工作提供一份(fèn)助力。
自(zì)然语言处(chù)理技术在(zài)对抗新(xīn)冠疫情中发挥了重(chóng)大作用。虽然自然语言处理技术不是万能神药,但可以帮助研究(jiū)人员更快地从医疗数据中提取更(gèng)有用的信息(xī),挖掘其(qí)中的(de)规律,从(cóng)而加快疫苗研发(fā)进(jìn)程,也有助于(yú)进行更有效的治疗。自然语(yǔ)言处理(lǐ)技术(shù)在本次疫情(qíng)中的(de)应(yīng)用证明其在分析医疗和(hé)临(lín)床(chuáng)数据(jù)中大有可(kě)为。
由(yóu)上(shàng)可知(zhī),自然语言处(chù)理可以在抗击新冠疫情中大显身手(shǒu),为打(dǎ)赢这场疫情攻坚战(zhàn)提供了极为有效的(de)技术支撑。有了自然(rán)语言处(chù)理技术相助,抗疫工作将变得更安全、更高效。正如中国著名(míng)学(xué)者周海(hǎi)中教授曾(céng)经所言(yán):“自然语言处(chù)理是极有吸引(yǐn)力(lì)的研究领域,它具有(yǒu)重大(dà)的理论意(yì)义和实用(yòng)价值。”
文/李言(作者单位:德国人工智能研究中心[DFKI])