乐动网页版_乐动(中国)


    咨询热线:021-80392549

    乐动网页版_乐动(中国) QQ在线 乐动网页版_乐动(中国) 企(qǐ)业微信
    乐动网页版_乐动(中国)
    乐动网页版_乐动(中国) 资讯 > 人工智能 > 正文

    三大“黑科技(jì)”加身,探(tàn)境科技AI语音芯片出(chū)货(huò)达百万级

    2019/12/30216

    IDC 预计,2019 年全球智能家居(jū)设(shè)备市场出(chū)货量将(jiāng)达到 8.327 亿台,将同比增长 26.9%。蛋糕之大让业界(jiè)一片欢腾,尤其是进入门槛较低的语音(yīn)识别应用市场,吸(xī)引了众(zhòng)多 AI 创业公司的目光,市面上出(chū)现了多款针(zhēn)对(duì)语音识别的 AI 芯片,其中不乏思必驰、云之声等算法厂商,还有出门问(wèn)问、若琪等终端厂商,语音 AI 芯片市场的竞争变得异常激烈。

    近期,探境科技也推(tuī)出了具有 AI 双(shuāng)麦降(jiàng)噪功能(néng)的(de)语音识别方(fāng)案(àn),即 Voitist 音旋风 612。可能很多人对探(tàn)境科技(jì)并(bìng)不(bú)是(shì)熟(shú)悉,其(qí)实这并不(bú)是一家新的 AI 公(gōng)司,而是(shì)在 2017 年就(jiù)已经成立,只是(shì)公司初期在埋头研发,因此很(hěn)少出现在公众的视野中(zhōng)。据其技术副总裁李(lǐ)同治介绍,“公司创始(shǐ)人鲁勇曾经在全球著名半导(dǎo)体(tǐ)公司 Marvell 担任研发高管(guǎn),研发(fā)团队(duì)有着给苹果、三星、希捷、西数、特斯拉(lā)等国际顶级公(gōng)司(sī)量产芯(xīn)片供货的经验,公司的目标是为客户提供终(zhōng)端人工智能芯片及(jí)整体解(jiě)决方案。如今,公司(sī)在北京、上(shàng)海、深圳、杭州、合(hé)肥(féi)及美国硅(guī)谷都设(shè)立了研发基地,目前(qián)公司员工近 200 人,其中(zhōng)技术(shù)研发(fā)人员 150 人,平均(jun1)研发(fā)经验在 15 年以上(shàng)。”

    在今年的 7 月份,探境科技就(jiù)推出了首款 AI 语(yǔ)音识别(bié)芯片音旋风 611,并且(qiě)已经量(liàng)产,李同治介绍,“音旋风 611 支(zhī)持多达(dá) 200 条命令词,能够覆盖家庭生活场景(jǐng)中(zhōng)几乎所有常见的语音控制(zhì)命令;在识别率方面,不低于 99%的唤醒(xǐng)率,超过 97%的识别(bié)率,以及低于 24 小时 1 次的(de)误唤(huàn)醒率。适(shì)用于各种需要(yào)语音进行(háng)控(kòng)制的应用场景,芯片内嵌(qiàn)领(lǐng)先(xiān)的 NPU 架(jià)构,配合(hé)单麦(mài)克(kè)风即可实现 5-10m 远距离的语音(yīn)识别,识别(bié)延迟小于 0.2 秒,不需要依赖云和网络,可在本(běn)地完(wán)成推理(lǐ)运算,音旋风 612 是 611 的升级版。”

    AI 公司以技术取胜才能走得(dé)更远,探境科技能(néng)够推出这样的产品也全依赖于(yú)技术驱动。AI 应用需要软件和硬件共同实现,市面上(shàng)的很多公司要(yào)么(me)单独(dú)做算(suàn)法(fǎ),要么单独做硬件,这就容易出现软件(jiàn)和硬件匹配困(kùn)难的问题,探境科技是在(zài)软件和(hé)硬件两方面同时研发,从而实现(xiàn)软硬件融合,包括芯片设计、结(jié)构框(kuàng)架、系统、算法等全部自主研发。在发布会(huì)上,探境科技负责人从硬件方面(miàn)介绍了(le)公司(sī)的独特技术(shù)存(cún)储优先架(jià)构,从(cóng)软件方(fāng)面(miàn)分(fèn)析了公司的三(sān)大(dà)黑科技。

    杀手锏:存储优先架(jià)构(gòu)

    传统的处理器一般都采用冯·诺伊曼体系结构(gòu),计算单元和存储单元相互独立,每次(cì)运算计算(suàn)单元将数据从存(cún)储(chǔ)单元中提取出来,处理完成后再(zài)写回存储单元中(zhōng)。近年来,处理(lǐ)器(qì)性能飞速(sù)提升,但是访问存储器的速度并没有相应的提升,所以访问存储(chǔ)器的速度无法跟上(shàng)处(chù)理器消耗数据的(de)速度,导致(zhì)处理器的计算性能无法充分发挥出来,这就出现“存储墙”问题。

    为了解决“存储墙”问题,探境(jìng)科技推出(chū)了存储(chǔ)优先架(jià)构(即(jí)SFA架构),这是一种不同的技(jì)术路线。探境科(kē)技创始(shǐ)人(rén)鲁(lǔ)勇(yǒng)解(jiě)释,所有深度学习算法和 AI 芯片都面临一个问题,它们并不是要做(zuò)卷积运算的乘法或加法,这并不是最难解决的(de)问题,难点是在于有很多数据(jù)在重复使(shǐ)用,数据在存储器里(lǐ)的位置、相对关系(xì)、读(dú)取的性能会影响(xiǎng)到(dào)算法(fǎ)运行的性(xìng)能。而(ér)且数据的存储带(dài)宽要(yào)求很大,存储功耗很(hěn)高。传统(tǒng)上的(de)解(jiě)决方(fāng)式(shì)不考虑存储墙(qiáng)的问题(tí),暴力增加存储单元,成本很高。我们用一种独特的芯片架构来(lái)推翻(fān)冯诺依曼体系架构,把数据读取的次数降低,降低数据的冗余,从而降低带宽的需求,通过算法和调度数据的(de)方式,改进数(shù)据管理,在硬件上(shàng)控制数据流,降低(dī)数据重复(fù)使用,通(tōng)过(guò)软件和硬件结合,在芯片上降低资源的链接复杂度,这种架构我们称为(wéi)存储优先架构(gòu),其实(shí)我们改善的(de)是芯片(piàn)本身的原因(yīn)。”

    portant;" />

    从效(xiào)果来看,鲁勇强调,“这种方法可以带(dài)来超高的(de)能效比(bǐ),数据访问(wèn)可降(jiàng)低(dī) 10-100 倍(bèi),存储子系统(tǒng)功耗下降(jiàng) 10 倍(bèi)以(yǐ)上(shàng),28nm 工艺系统能效超过 4T Ops/W。”

    鲁勇将(jiāng) SFA 架构(gòu)称为真正符(fú)合商业应用的 AI 芯片架构,因为(wéi)其采用(yòng)成熟的设(shè)计方案,无需对底(dǐ)层器件进行修改(gǎi)设计,可以(yǐ)走商业化路径(jìng);通用性高(gāo),芯(xīn)片面(miàn)向的场景众多,必须支持多种算法才可以被商(shāng)业(yè)化;同时易用性高,用户学(xué)习(xí)成(chéng)本低,模型移植简单。

    需要指出的(de)是,一般(bān) AI 芯片只针对某一神(shén)经网(wǎng)络(luò)进行运算,SFA 架构支(zhī)持任何神经网络,而且可以(yǐ)调整参数。

    存(cún)储(chǔ)优先算法既(jì)然如此高效,为什(shí)么其(qí)它 AI 公司(sī)没(méi)有开(kāi)发?鲁勇的解释是,这是一项有技(jì)术门槛的(de)技术,不仅(jǐn)在技术上需要(yào)要懂数学原理(lǐ)、架构、数据管理知识,同时需要有丰(fēng)富的芯片设计经验,综(zōng)合起来才能做到高效率,这(zhè)些都是探(tàn)境(jìng)科(kē)技所具(jù)备(bèi)的。

    如果(guǒ)说存储优先架构是探(tàn)境科技在硬件上实(shí)现的优(yōu)化,软件上(shàng)又做(zuò)了哪些(xiē)工作?李同治向我们做(zuò)了(le)详(xiáng)细介绍。

    三大黑科技加身,出货量过百万

    李(lǐ)同治将探境科技在软件上的创新归结为三大(dà)“黑科技”,分别是 AI 降噪算法(fǎ)、高计算强度神经(jīng)网络 HONN、基于 FCSP 的(de)端到端 AI 双麦算法。

    黑科技(jì)之一:AI降噪算(suàn)法

    目(mù)前在智能(néng)家居应用中,语音识别面临环(huán)境噪杂或者(zhě)距离远,从而导致识别不清(qīng)的难题,智能家居设备厂家急需一种(zhǒng)能够准(zhǔn)确过滤噪音,并(bìng)提(tí)取目标声源的方案。

    portant;" />

    在语音识别技术中,信噪比(bǐ)是衡(héng)量识(shí)别的目标声源与其它(tā)干(gàn)扰声源强度比(bǐ)值(zhí)的对(duì)数。一般将信噪比低于(yú) 15dB 的称为(wéi)噪声环境。信噪比越低,识(shí)别难度越大。在(zài)语音识别的研发过(guò)程中,一个(gè)完整的(de)识别链路(lù)可以简化为麦克风输入、降噪(zào)处(chù)理、语音识别、识(shí)别结果输入四个环节(jiē)。想做好识别,首先要在(zài)降噪处理上(shàng)下功夫。

    探境科技自研了 AI 降噪(zào)算法基于深度学习,不仅能够处理稳态的噪(zào)声,非稳态的突发性噪声(shēng)也能快速过滤。为(wéi)了验证探境(jìng) AI 降噪算(suàn)法的有效性,技(jì)术人员(yuán)将(jiāng)一批信噪比在 3dB 左右的语音数据送到一(yī)个(gè)知(zhī)名的云端公(gōng)开(kāi)语音识别(bié)引擎做了测试,降噪后比降噪前(qián)提(tí)高 30%识别准确率(lǜ)。

    黑科(kē)技之二(èr):高(gāo)计算强度神经网络HONN

    在对声(shēng)音进行降噪处理之后,就进(jìn)入到了语音识别(bié)环节。在这一环节中,神(shén)经网络模型所需的(de)算(suàn)力(lì)决(jué)定了(le)模型的(de)描(miáo)述(shù)能力(lì),同(tóng)时(shí)也决(jué)定(dìng)了模型处理能(néng)力和(hé)识别率的上限。在(zài)传统的语音识别算法里,国内很(hěn)多语(yǔ)音识别芯片都采(cǎi)用了全连接操作 DNN 技术。但是(shì)相(xiàng)对全(quán)连接操作(zuò),卷积操作(zuò)能够提供更高的计算(suàn)强度,且卷积(jī)运算与人类大脑(nǎo)负(fù)责(zé)感知模块的(de)处(chù)理方法类似,能够提(tí)取满(mǎn)足大脑认知的本质特征。

    探境将其计算机视(shì)觉中的一(yī)些经验(yàn)迁移到语音识(shí)别中,在语音识别算法上加入了更多的卷积(jī)操作,重新设(shè)计了一(yī)个高计(jì)算强度的神经(jīng)网(wǎng)络,即 HONN(High Operation Neural Network)。

    portant;" />

    李同治(zhì)解释,“对比发现,HONN 仅需要 350k 的(de)存储空间,而(ér) DNN 需要 1.6M 的存储(chǔ)空间,更低(dī)的存储(chǔ)需求意味着成(chéng)本(běn)更低。同时 DNN 与 HONN 所需的算力相反(fǎn),处理高强度模型单(dān)帧(zhēn)时,HONN 需要超过几百(bǎi)兆(zhào) OPS,而一般(bān)的 DNN 模型(xíng)仅为(wéi)个位数的算力,两(liǎng)者(zhě)相差超(chāo)过 30 倍。对于神(shén)经网络来说,模型所需的算(suàn)力决定了(le)模型(xíng)识(shí)别率(lǜ)的上限。相对安静的(de)环境下(xià)两者之间差别不大,但是当信噪比进一步(bù)降(jiàng)低时,基于 HONN 的(de)方法识别(bié)优势非常明显。”

    在实际测试中(zhōng),在抽油烟机的噪音中(大约 70 分(fèn)贝),HONN 方式下的识别信噪比约为 3~5dB,单(dān)灯模型的识(shí)别效果非(fēi)常准确。

    黑(hēi)科(kē)技之三:基于FCSP的端到端AI双麦算法(fǎ)

    信噪比还有一(yī)种更严苛的情况,就(jiù)是 0dB 和负(fù) dB,0dB 意(yì)味着噪声和信号(hào)强(qiáng)度一样(yàng),甚至(zhì)噪声(shēng)比语(yǔ)音(yīn)信号还(hái)要强,面(miàn)对这种应(yīng)用场景,探境科(kē)技采用了基于(yú) FCSP 的端到端 AI 双麦(mài)算法。

    portant;" />

    传统的(de)麦克风阵列处理算法有(yǒu)几大缺点,从而造成处理效果并不(bú)理想。“为了(le)克服(fú)传统处理方式的缺点,我们设计出了基(jī)于 FCSP 的端到端 AI 双麦算法。”李同治对记者表(biǎo)示“FCSP(Frequency Complex Subspace Projection)是(shì)我们(men)自研的频域复(fù)数(shù)子空(kōng)间投(tóu)影(yǐng)算法(fǎ)的简称,这个算(suàn)法直接输(shū)入(rù)阵列信(xìn)号,输出的是最终(zhōng)的(de)识别结果,中间部(bù)分全(quán)部交给基于深度学习的 AI 算法来处理,不(bú)再使用传统的数字信号处(chù)理(lǐ)方法(fǎ)。信号增强(qiáng)与识别模块整体(tǐ)以降低识别错误率为(wéi)目标(biāo)进行优化,避免了语音增强与语音识别模块(kuài)错配的问题。”

    另外,在模型(xíng)训练(liàn)期间,采取了“注意力增强”的(de)学习方(fāng)法,能(néng)够灵敏(mǐn)的(de)检测到唤醒词和命(mìng)令(lìng)词(cí),即使干扰信号与(yǔ)目标(biāo)信号方(fāng)向接(jiē)近,也(yě)能灵敏的进(jìn)行唤醒和识(shí)别。李同治做(zuò)了(le)一个形象的比喻,“这(zhè)个类似于在(zài)一个嘈杂的环境里面(miàn),如果有人(rén)喊自己(jǐ)的名(míng)字(zì),一下子就能反(fǎn)应过来。”

    李同治强调(diào),“我(wǒ)们采取(qǔ)了频域复数子空间(jiān)投(tóu)影,抗噪(zào)性(xìng)能强,在信噪(zào)比为 0dB 时,相对于传统的处理算法,相对识别错误率降低超过 20%。”

    通过 AI 语音(yīn)算法+HONN 神经(jīng)网络模型来(lái)提(tí)升(shēng)识别率,再(zài)通(tōng)过(guò) FCSP“端到端”的双麦处理(lǐ)算法简化(huà)识(shí)别流程,降低最终识别错误率,探境(jìng)的语(yǔ)音算法实现(xiàn)了跨越(yuè)式的升级,加上通过存储优先架构打造的 AI 芯片,探境科(kē)技可(kě)以为客户提供芯(xīn)片、算法俱全的(de) Turn-key 方案。

    除了支持 AI 双(shuāng)麦的(de) Voitist 音旋风(fēng) 612 之外,还包(bāo)括在(zài)离线一体的 Voitist 音旋风 621、以及语音芯(xīn)片(piàn)的旗舰产品——可支持(chí)本地(dì) NLP 的音旋风(fēng) 7 系列(liè)。探境目前拥有约(yuē) 30 家合作伙伴,既有美的、海尔等智能家居制造大(dà)厂,也有世强科技(jì)在垂直(zhí)领域颇具影响力的渠道商,知名智能家(jiā)居(jū)制造商阿凡达智控也刚刚与探境达(dá)成合作,目前,探境科技(jì)的产品出货量已达百万(wàn)级别。

    未来规划:从语(yǔ)音到(dào)图(tú)像,离线在线一(yī)体方案已在(zài)路上(shàng)

    近两(liǎng)年(nián),边缘计(jì)算大热,随着数据(jù)量(liàng)不断(duàn)增大,云(yún)端(duān)的承载压(yā)力越来越大,因此终端客户寻求(qiú)在(zài)边缘完成部分数据处理,从而分担云端的压力(lì)。尤其(qí)在 AI 领域,未来对延迟和带(dài)宽提出(chū)更苛刻的要求,探境科技也认为,真正的人(rén)工智能应用(yòng)场景(jǐng),是不需要借助(zhù)云端服务等做远程(chéng)支持的(de),只有将人工智能做到终端(duān)上来,让每个设(shè)备都具备人工智能,才是(shì)现阶段“人工智(zhì)能”的进(jìn)化(huà)。

    portant;" />

    目前厂(chǎng)商多采用在线方案,就是打(dǎ)一个数(shù)据包放(fàng)到云端,而离(lí)线方案是语音识别算(suàn)法在本地(dì),音(yīn)乐等播放内(nèi)容还是放在云端。据鲁(lǔ)勇透露,未来探境还会将语(yǔ)音产(chǎn)品进行(háng)二次(cì)升级,推出更多在线离线一体化方案。探境科技采用 HONN 神(shén)经网络模型,意味着处理(lǐ)模型变小(xiǎo),放(fàng)在(zài)边缘(yuán)的存储(chǔ)容量变小,成(chéng)本也随(suí)之(zhī)降低。关于(yú)用户(hù)对在线(xiàn)方(fāng)案和离(lí)在线一(yī)起(qǐ)方(fāng)案(àn)的(de)选择,鲁勇表示,离线在线一(yī)体方案和在线方案两种会共存,毕竟(jìng)用户的想法不同,选择也不(bú)同。

    portant;" />

    关于产品规划(huá),鲁勇还表示,“探境不仅(jǐn)仅是一个语音芯片公司,而是一家(jiā)语音、图像整体结合(hé)的 AI 芯片公司。除(chú)了语言市场之外,我们还(hái)看好工业视觉、新(xīn)零售、安防、辅助驾驶等市场。我们的图像芯(xīn)片(piàn)在 2019 年 Q4 就已经流片成功,在(zài)某些应(yīng)用中已经(jīng)开始产生营收。AI 芯片的(de)蛋糕非常大(dà),探(tàn)境希望可(kě)以联合上下(xià)游(yóu)一起(qǐ),开发生态,开放 SDK 和工(gōng)具(jù)链,不(bú)仅(jǐn)是大家可(kě)以直接使用(yòng)我们的产品(pǐn),我们也(yě)希望有(yǒu)大量的(de)合作伙(huǒ)伴,完成更多(duō)的(de)场景开发。”

    鲁(lǔ)勇(yǒng)认为,AI 芯(xīn)片(piàn)这(zhè)一领域(yù)不像手机 APP 那样,瞬间可以凭一(yī)款应用获得数(shù)百万的用户,AI 芯(xīn)片更像马拉松长跑,比的是耐力,而(ér)不是冲刺速度,在(zài)这场比(bǐ)赛中,不是要看谁跑(pǎo)得快,而是要看谁有(yǒu)潜力到达终点,谁在中途不走岔路。探(tàn)境作为创业(yè)公司(sī),虽然进(jìn)入市(shì)场比较晚(wǎn),但是这(zhè)也是一个拐点期,市场教育工作已经完成,后(hòu)面市(shì)场竞争还(hái)是看核心技术,我们的优势在于(yú)软件(jiàn)和硬件都自主研发,因此算法移植非常(cháng)快,我们将从智(zhì)能家居领域开始,先打好地基,再逐(zhú)渐加码,等待(dài)市场大潮的到(dào)来。

    关键词(cí):




    AI人工智能网声明:

    凡资讯来源注(zhù)明为其他媒(méi)体(tǐ)来源的信息,均为转载自其他媒体,并不代表本网站赞同其(qí)观点,也不代表(biǎo)本网站对其真(zhēn)实性负责(zé)。您若(ruò)对该(gāi)文章内容有任何疑问或质(zhì)疑,请立即与网站(www.bz.xinxiang.zz.pingliang.ww38.viennacitytours.com)联系,本网站将(jiāng)迅速给您(nín)回应(yīng)并做处(chù)理。


    联系电话:021-31666777   新闻、技术文章投稿QQ:3267146135   投稿邮箱:syy@gongboshi.com

    精选资讯(xùn)更多(duō)

    相关资讯更(gèng)多

    热(rè)门搜(sōu)索

    工博士人工(gōng)智(zhì)能网
    乐动网页版_乐动(中国)
    扫描二维码关注微信
    扫码反馈

    扫一扫(sǎo),反馈当前页面(miàn)

    咨询(xún)反馈(kuì)
    扫码关注(zhù)

    微信公众号

    返回顶部(bù)

    乐动网页版_乐动(中国)

    乐动网页版_乐动(中国)