由(yóu)声智科技研(yán)发的“AI数字人垃(lā)圾分类管家”融合了人脸(liǎn)识别、智能语音交(jiāo)互、行为识(shí)别等技术,使垃圾分(fèn)类管理更加(jiā)方(fāng)便快速(sù)。
一(yī)台可以书写的智能交互(hù)机械臂,用毛笔写下“一起向未来”;一部(bù)多足行(háng)走机(jī)器人和一部跳(tiào)舞机器人(rén),共同(tóng)跳起了一(yī)段舞蹈,随后,跳舞机器人还(hái)单独(dú)进行了一段武术表(biǎo)演,抱(bào)拳(quán)开臂,马步弓步,一招一(yī)式憨(hān)态可掬。这是记(jì)者在北京声智科技(jì)有(yǒu)限(xiàn)公司(以下称(chēng)“声(shēng)智科技”)展厅里看到的景象。
声智科(kē)技成立于2016年,专注于声学前沿技术和(hé)人(rén)工智能领域,主要面向数(shù)智健康(kāng)、数智城(chéng)市等场景提供(gòng)产品(pǐn)和解决方(fāng)案。凭借持续创新研发,声(shēng)智科技获得了吴文(wén)俊人工智能科学(xué)技(jì)术奖、北京市科技(jì)进(jìn)步(bù)二等奖等多个奖项。
突破技术难点(diǎn)
“声(shēng)智科技是(shì)从研发远(yuǎn)场(chǎng)语(yǔ)音交互技术起步(bù)的,你刚才(cái)看到的那几(jǐ)个智能(néng)机(jī)器(qì)人搭载了(le)声智科技研发的(de)智能(néng)语音交互技术。”声智科技创始人陈孝良说,随着物联网技术的普及,语音成为人机交互的新入(rù)口,支持远场语音(yīn)交互的产品市场潜力很大。
“远场语(yǔ)音识别技术(shù)面临(lín)诸多研发难(nán)点,比如环境(jìng)噪声、人声、房间(jiān)混(hún)响(xiǎng)的干扰等(děng)。若采(cǎi)用常规语音(yīn)处理方法,会导致信号失真和资源(yuán)消耗(hào)大,使得语音识(shí)别技术准确率低,应(yīng)用(yòng)困难。”陈(chén)孝良说(shuō)。
凭借深厚(hòu)技术积(jī)累和持(chí)续研(yán)发,声智科技先(xiān)后攻克了多项(xiàng)远场语音交互关键技术,包(bāo)括回声抵消技术(shù)、噪声消除(chú)技术、声源定位(wèi)技术、语音(yīn)识别技术等(děng)。如今,这些技术已应用于一些(xiē)消(xiāo)费级电子产品中,声智科(kē)技(jì)也成为国(guó)内不少知名企业的合作伙伴。
“我们(men)意识到(dào),伴随着人工智能的快速发展,人(rén)机交互、协同过程中的多数(shù)问(wèn)题,都不能(néng)靠单(dān)一技术解决(jué),需(xū)要(yào)将语音、图像识别、大数据等技术结(jié)合起来。只有(yǒu)推进(jìn)多模态、多技(jì)能的融合(hé),才能实现更多(duō)场景的(de)应用。”声智科技副总裁李良(liáng)斌说(shuō)。
他介绍,声智(zhì)科技的做法是,用“多模(mó)态”确(què)保机器具有“声、光、电、热、力、磁”多(duō)种感知(zhī)技术;用“远场”解(jiě)决机器在远距(jù)离场域中对(duì)多(duō)模态(tài)信号的分(fèn)析;用“多技(jì)能(néng)”赋予智能系统多种能力,通过多技能相互(hù)协(xié)同(tóng),完成复杂任务。
基于这种技术理念,声智科(kē)技研(yán)发推出核心(xīn)技术产品——壹元人工智能开发框架。基于这个框架,声智(zhì)科技融合了远场声(shēng)光、多模态识别等多项(xiàng)技术,围绕智慧社区、智慧交通、智(zhì)慧办公、智慧医院等应用场景,提供AI产品及解决方案。
截至(zhì)目前,声智科技已(yǐ)经参与了50余项国家行业标(biāo)准的制定(dìng),拥有国内专利2000余项。在2020年前,声智科(kē)技总融资金额(é)超过3亿元。陈(chén)孝(xiào)良说,这些融(róng)资全部投入到核心技术的持(chí)续研发(fā)上。
助(zhù)力智(zhì)慧防疫
新(xīn)冠肺炎疫情(qíng)暴发以来,声智科技自主研(yán)发(fā)的技术产品,用于多地(dì)的防疫服务(wù)中。
记(jì)者(zhě)刚走进中关村前(qián)沿技术创(chuàng)新(xīn)中心(xīn)的一楼大厅,就听到清脆的声音:“您(nín)现在(zài)的体(tǐ)温是36.5摄氏度,没有发热症状”。声音来自一台测温(wēn)机器人,在机(jī)器人显(xiǎn)示(shì)屏上,除了实时显示被检测者的(de)红外热成像信(xìn)息(xī)和温度值,还(hái)能查(chá)看全国疫(yì)情(qíng)数据,测(cè)温精度在正负(fù)0.2摄氏度。
声智科技首席知识官常乐介(jiè)绍,这个测温(wēn)机器人可在几秒钟内完(wán)成1米至6米(mǐ)范围内多个目标的高精度测温,支持实时AI语(yǔ)音合成播报,自动(dòng)上传预警信息。目前,该(gāi)机器(qì)人已在北京、广州、青岛、成都等地落地使用。
“小易小易,上楼(lóu)”“小(xiǎo)易小易,去10楼”,在(zài)北京海淀医(yī)院(yuàn)的电梯里(lǐ),只需要(yào)一句简单(dān)的指令,就能实现乘(chéng)梯上下楼,全(quán)程免按键,实现零接(jiē)触。
“声智科(kē)技研(yán)发的(de)智慧(huì)语音电梯,融(róng)合语(yǔ)音与(yǔ)图像(xiàng)等交互技术,不依赖手机、IC卡等设备,无论使(shǐ)用者是在(zài)电梯(tī)外,还是(shì)在电梯轿厢(xiāng)内,都可以通过可视化人(rén)机(jī)交互方式搭乘电(diàn)梯。”常(cháng)乐介绍,这方便了老人、儿童等用户(hù)的日常生活,在疫情防(fáng)控期间还有效降低了接触传播感染风险。
目前,声智科(kē)技已推出第(dì)二代(dài)AI智能电梯系统,增加手势识别功(gōng)能,残障人士也可(kě)以实(shí)现(xiàn)免接触控制电梯。2021年,为(wéi)解决电动(dòng)自(zì)行车(chē)入户充电(diàn)的监管难题,减少(shǎo)电池充电爆炸起火等隐患(huàn),企业又迭代推出了第三代AI智能电(diàn)梯。
“未(wèi)来,我们希(xī)望AI技术能满足(zú)复杂场景的灵活、大(dà)范围应用。”李(lǐ)良斌表示,声智科技(jì)将继续加强(qiáng)核心技术研发,让更多(duō)AI产品(pǐn)落地,使万物互联(lián)更智(zhì)能。