11月8日(rì),猎豹移动董事长兼 CEO 傅盛出席第五(wǔ)届世界(jiè)互联网大会(huì)“物(wù)联网:连接无处不在”论(lùn)坛,并发表题为《真开(kāi)放·全链条AI技术赋能物联网》的(de)主(zhǔ)题演讲(jiǎng)。
猎豹移动董事长兼CEO傅盛
傅盛(shèng)表示,即便是(shì)在今(jīn)天的生产线上,也很难解决设备智能化的(de)问题,而AI让机器第一次拥有了人类的感知能力,也(yě)让物联网终端更聪(cōng)明。这是一个巨大的分水(shuǐ)岭(lǐng),使得AIoT的概(gài)念开始出现。在行业和(hé)自身的(de)变革背景下,猎(liè)豹移动携(xié)旗(qí)下(xià)人(rén)工智能公司猎户星空(kōng),研(yán)发了包(bāo)括语音识别、视觉识别、室内导航(háng)平(píng)台等在(zài)内的行业唯一全链条AI技术。
他说到,“我们未来不会单做一款硬件(jiàn),我们致力于打造AI赋能的云端操作系(xì)统(tǒng),跟开发者一起做更多的物联网设备(bèi)。”
以下是演讲全文(wén):
首先,我花(huā)一点时间介绍一下猎豹移动(dòng)。猎(liè)豹移动是一家经历过三次跨(kuà)越(yuè)的公(gōng)司,2010年由(yóu)我自己创办的(de)可牛影像和金(jīn)山安全合并而成。
当时我们经历(lì)的第一波是PC杀毒软(ruǎn)件免费化,实现了第一(yī)次的增长。
第二波在移动(dòng)互联网的时候,我们碰到了强大的对手,决定出海。我们是第一(yī)家大规模的把用户做到海外的中国(guó)公司。今天,猎豹(bào)移动大概(gài)有5亿多的月(yuè)度活跃(yuè)用(yòng)户,其中80%来自于海外,完全走(zǒu)出(chū)了一条不一样的曲线,我(wǒ)们内部叫做“天外飞(fēi)仙”。所以(yǐ)我们现在(zài)依然是Google工具排行榜的第一,我们游戏的下载次数(shù)在全球接近20亿(yì)次。
第三波(bō)是(shì)在2014年上市以(yǐ)后(hòu)。我当时就意识到(dào),整个移(yí)动互联网的风(fēng)口将尽,我们(men)需要寻(xún)找下一个机会。我(wǒ)们在硅谷、以色列(liè)都投资了基金,由此(cǐ)看到了人工智能的机会。
AI让机器拥有感知能力 全力以(yǐ)赴打造全链条(tiáo)AI技术
我(wǒ)对人工智能有一些自己的理解和思考,我们讲(jiǎng)了很久的物联(lián)网、智能硬件,其实(shí)在AI或者(zhě)人工智(zhì)能出现之(zhī)前,所有的智能硬件都(dōu)是伪智能硬件。那个时候的智(zhì)能硬件本(běn)质上是联网硬件,你要掏出手机进行(háng)操作。大(dà)概在(zài)三五年前,各种智能硬件的(de)行业(yè)都起来了,但是很快(kuài)这个行业又衰(shuāi)落了。
我甚(shèn)至想要把机器人行业划(huá)分(fèn)成(chéng)两(liǎng)个分水(shuǐ)岭。在AI出现之前的机器人本质上都是自动化(huà)机器,没(méi)有人的属性。我们看产线上那么多(duō)漂亮的(de)机(jī)械手,其实都(dōu)是通过非常原始的编(biān)程和自(zì)动化(huà)的设备进行生产的。即便今天在生产线上,也很难解决智(zhì)能化(huà)的问题。
但AI出(chū)现以后(hòu),第(dì)一次让机器有了人类的感知能力,我(wǒ)们以(yǐ)前的(de)摄像头看到的都(dōu)是0101等一串数字,但今天摄像头看到(dào)的是(shì)人脸(liǎn);以(yǐ)前看(kàn)到的语(yǔ)音是波形(xíng),我们现(xiàn)在看到的语音是文字。
机(jī)器开始有了人(rén)类的感知能力,使得AIoT的概念开始出(chū)现,看到这个机(jī)会以后,我们就去做了(le)行(háng)业唯一的全链(liàn)条AI技术。包括语音(yīn)识别、视(shì)觉识别、导航、机械(xiè)臂、麦克风(fēng)阵列(liè)等,为什么要做呢?
这是(shì)从内外两个(gè)方面思考的。
第(dì)一个,猎豹移(yí)动在以前做(zuò)的太快了。我(wǒ)们就(jiù)做(zuò)一个小工具,居然就上市了。后来(lái)等到Google发政策(cè)不让我们(men)做工具,手机厂商都开始自己做(zuò)工具的时候(hòu),我们的(de)日子就变得很艰(jiān)难。所以我(wǒ)当时就想,拥有自己(jǐ)的底层技(jì)术很关键。
第二个,因(yīn)为AI行业还处于早期。很多(duō)技术都不完(wán)善,或者没有形成产业分工(gōng)。但很多开发者,拿一块板(bǎn)子,拿一个所谓的开放平台,就(jiù)想实现很(hěn)好的语(yǔ)音识别(bié)效(xiào)果,其实是非常难的。以智能音箱(xiāng)为例,换一个外壳罩上去,算法(fǎ)就得调整,因为混响(xiǎng)不一(yī)样。就(jiù)像,在(zài)你的耳朵上(shàng)加(jiā)一个耳塞,听力就可能大(dà)幅度(dù)下降,和你的大脑聪(cōng)不聪明没关(guān)系(xì)。所以(yǐ)整(zhěng)个人工智(zhì)能产业的(de)链条都非常(cháng)新,又没(méi)有足(zú)够(gòu)的分(fèn)工。
第三个,我意识到,AI其实并不算是一个不可逾越的(de)黑科技。很多人(rén)都说,BAT才能做AI,或(huò)者(zhě)人家的积累更好一点。但(dàn)是今天(tiān)看来,开源代码(mǎ)会远远丰富于任何(hé)一(yī)个时代。很多大(dà)洋(yáng)彼岸的论文出现之后,中国的工程师就很快把它实现了。所以,好处就在于(yú),AI大(dà)大降(jiàng)低了技术壁垒。而且AI使得以前很多(duō)公司的积(jī)累变得(dé)无效,大家处在(zài)同一起跑线上。我们(men)认为,这是一个弯道(dào)超车的好机会。
所(suǒ)以,我(wǒ)们(men)当时就(jiù)下定(dìng)决心,把所以技术全都干了一遍,全(quán)力以赴打造全(quán)链条 AI 技术。全干一遍的(de)好处就是,我(wǒ)们能(néng)够自主调整(zhěng)很多(duō)细节(jiē)。
语音交互实现(xiàn)了命令的自然化 可能颠覆手机的(de)中心地位
我认为真正有智能的第一个硬件(jiàn)品类(lèi),应该是智能音箱,我一(yī)直在想,语(yǔ)音(yīn)识别是什么东西(xī)?今(jīn)天有人(rén)谈“语(yǔ)义理解能力超过人”。只要(yào)看到这种标题,基本上都是骗子。
为(wéi)什么(me)这么说?在语(yǔ)义的(de)理解上,AI离人有巨大(dà)的差(chà)距。因为语言是人(rén)类超级牛(niú)的(de)发明(míng),你能够把你对世界的理解,压缩成一串很短(duǎn)的文字输入给对方,对方听完以后,能把(bǎ)这(zhè)个图像、事件还原出来(lái),这是个相(xiàng)当牛的能力,人类之(zhī)间的交(jiāo)流是带有巨大(dà)的(de)信息(xī)压缩和背(bèi)景知识(shí)的。
所以,今(jīn)天机器完全做不到。AI想在阅读理解上超过人类,那(nà)是(shì)在一(yī)个很有限(xiàn)的短文(wén)章里,没有(yǒu)实(shí)际意义(yì)。
真正的语音操作是(shì)什么?我认(rèn)为(wéi)它(tā)的本质是实现(xiàn)了命令的自然化。乔布斯有一句话说,每一(yī)次交互操作的演进都是(shì)一次革命(mìng)。苹果(guǒ)有(yǒu)幸抓(zhuā)住了两次革命,第一个是抓住了(le)键盘和鼠标,第(dì)二(èr)个是抓(zhuā)住了触(chù)摸屏。
今天的(de)手机不是因为它(tā)有多么(me)智能,而是(shì)因(yīn)为它有(yǒu)强大的处(chù)理能力,你可以非(fēi)常(cháng)方(fāng)便(biàn)地touch。所(suǒ)以手机立刻取代了以前的PC、电视,成为了你(nǐ)的中心位置。
但语音使得手机(jī)的中(zhōng)心位(wèi)置(zhì)有(yǒu)可(kě)能被(bèi)颠(diān)覆掉(diào),你想象一(yī)下,语音是什么?比如,你想看《延禧攻略》,以(yǐ)往你(nǐ)需要从(cóng)口袋里掏一个东西,解锁、搜索,未来可以用语音就直接唤醒:我想看《延禧(xǐ)攻略》。
我甚至认(rèn)为,虽然手机还(hái)是个非常(cháng)关键性的设(shè)备(bèi),但下(xià)一(yī)代设备(bèi)都(dōu)可以变得去手机化。
两年前(qián),我们是业(yè)内第二款做智能音箱的厂商(shāng)。我(wǒ)们(联合喜马拉(lā)雅(yǎ))做了一款小雅音箱,当时(shí)很多人(rén)就问我(wǒ),智(zhì)能(néng)音箱有多智能呢?我(wǒ)回答:你不要考虑它(tā)有多(duō)智能,你只要(yào)考虑它是个摇控器,能(néng)够非(fēi)常简单地点歌(gē)、了解天(tiān)气,设(shè)置闹钟(zhōng)。我们买来了对(duì)手的产品,我们发现点(diǎn)歌根本点不准,只(zhī)有50%的准确率(lǜ)。为什么?不是(shì)语(yǔ)音识别的问题,而(ér)是内容上(shàng)的问题。比如说今天抖音出了(le)个神曲叫《我们一起(qǐ)学猫(māo)叫》,你的曲(qǔ)库里得有这(zhè)首歌。有的(de)时候用户说叫“学猫叫”,有(yǒu)的说喵喵喵,有多种的说法。这不是一个智能(néng)的活儿,这是个产品的活儿。
所以我们(men)就(jiù)把音乐的点播率和内容(róng)的点播率(lǜ),这一件事儿做(zuò)好了。当时,我觉得智能音(yīn)箱的核心不是它有多智能,而是(shì)一种(zhǒng)新(xīn)的(de)交互模式。这种新的交互模式本质上(shàng)就(jiù)是一个摇(yáo)控器,它把极(jí)其复(fù)杂难用的摇控器给改掉了(le),这个进步(bù)是非常巨大的。
iphoness刚出来的(de)时候,大家(jiā)说这个没有全键盘、没有硬键盘怎么用,输入内容(róng)太慢(màn)了。但就是因为它方(fāng)便,你可(kě)以容(róng)忍它非常(cháng)多不够快速的地方。
我(wǒ)们赋能了很(hěn)多物联网的中枢,我坚定(dìng)的认为,语(yǔ)音(yīn)是下一代操作系统的(de)界面,它一定(dìng)可以使得物联网的很(hěn)多设备变得智能。可(kě)以(yǐ)跟你直(zhí)接交互,不(bú)需要通过手机APP的(de)方(fāng)式,它自己(jǐ)就(jiù)被赋能了。我们跟很多厂商合作(zuò)了很多款(kuǎn)音箱,因为我们觉得(dé)打音(yīn)箱(xiāng)上的战役可能打(dǎ)不过,但是合作是有机会(huì)的。
人工智能不会颠覆(fù)人 只要(yào)一点突破就会带来变革
我们还做了一款(kuǎn)能移动的售卖机(jī)——零售机器人豹小(xiǎo)贩(fàn),它(tā)会(huì)主动问你是否需要商品,用户扫描二(èr)维(wéi)码就可以(yǐ)购买。看到(dào)人多的地(dì)方它就会(huì)过(guò)去,因为它有人脸识别技(jì)术。以前,售卖机只能放在一个地方,如(rú)今,自动(dòng)售卖机的售卖效(xiào)率,大概是传统的三到五倍,用互(hù)联网的定律(lǜ)看,当多(duō)一个链接,互联网就损失(shī)了(le)50%以上的流量。而在线下零售端,当你从(cóng)原有的位置走出来,让用户(hù)看到有一点点改(gǎi)进,效率的改变是巨大(dà)的。
在机械臂方面,我专门去发那(nà)科(kē)看过他们的生产线。我个人觉得,在(zài)精密(mì)制造上和日本、德国企业去比拼,是没有机会的。因为他们(men)是三十(shí)年的积(jī)累,可以用机械臂生(shēng)产机(jī)械臂。但(dàn)是他们面(miàn)临一(yī)个(gè)问题:整个产线投产周期非(fēi)常(cháng)长,他要(yào)改变一个(gè)产品的时候,整(zhěng)条产线都要变,成本非常高。
我一直在(zài)想(xiǎng),AI 出现之后(hòu),可能不需要精密(mì)的机械臂,来做生(shēng)产。我(wǒ)想到我(wǒ)奶奶的手,哆哆嗦嗦的,但(dàn)她仍然(rán)能够织毛衣,还可以穿针引线(xiàn)。核心不是(shì)因为(wéi)她的肌肉能够多么精确地控制,而是因为她能(néng)用眼睛做最后一点点调(diào)整。
受此启发,我们在机械(xiè)臂上加(jiā)上了摄(shè)像(xiàng)头,使得(dé)它去抓杯子的时候,杯子(zǐ)怎么样放都可以抓(zhuā)得到,这样可以降(jiàng)低对(duì)机械臂精度的要求。
做机械(xiè)臂(bì)的(de)机床,如(rú)果从日本买,大概需要 2000 万的投资,六(liù)个月之后(hòu)拿货,我们现(xiàn)在正在尝试用韩国产的机床为我们做谐(xié)波(bō)减速(sù)器,未(wèi)来可能用国产(chǎn)的机(jī)床(chuáng)。虽然精度降低了一点(diǎn)点,由于由于有视觉(jiào)技术,所以它最后肯定能完(wán)成动作。
因(yīn)为机(jī)械臂最大的(de)成(chéng)本就来自(zì)于谐波减速器(qì),我们正在做的(de)机(jī)械(xiè)臂,未来可以降到市场价格的三分之一(yī)。当机械臂的(de)价格(gé)降低,可能会产生新的、比(bǐ)工业市场大十倍的市(shì)场,市场增(zēng)大十倍之后,成本又会进一步降低。在(zài) AI 赋能之后(hòu),机械臂是有可能实现跨(kuà)越式增长的(de)。
在接待(dài)服务方面(miàn),如(rú)果大家(jiā)有兴趣的话,可以去猎豹移动参观一下。我(wǒ)们的前台已(yǐ)经(jīng)是机器人接待了,我们是一家没有前台的(de)公司,只(zhī)有机(jī)器人。你(nǐ)来的时候,我(wǒ)在OA上提一个申请,然后你(nǐ)会(huì)收到一条数字码(mǎ),机器人(rén)就会过(guò)来。你(nǐ)跟它(tā)说“我(wǒ)来面试(shì)”或者开会,把数字码输上,它(tā)给你拍张照,在我们的闸机上刷(shuā)一下(xià)脸,你就可以进(jìn)入公(gōng)司,它也会带你(nǐ)去(qù)会议(yì)室。
今天讲人(rén)工智(zhì)能,很多人太强调所谓颠覆人的智能,这条路我还(hái)没有看到颠(diān)覆人的地方(fāng)。但核(hé)心是有可能实现一点点突破,比如说它能够把原来的(de)0101这(zhè)种(zhǒng)信号,对应成真正的人脸和语音的字节(jiē)的时(shí)候(hòu),其实(shí)我觉得这个(gè)机会就已经非(fēi)常非常巨(jù)大(dà)了。它会让很(hěn)多设备具(jù)备人(rén)的感知能力,在(zài)一个非常垂直的领域,完成一点点(diǎn)工作。这一点点工作,可能(néng)会带来巨大的变(biàn)革。
我(wǒ)们(men)最近刚(gāng)跟一个酒店签约,我们的音箱进(jìn)酒店了。以后(hòu)你到房间(jiān)以后,你就直接(jiē)可以说,开灯。你可以跟音箱(xiāng)说:“给我来(lái)支(zhī)牙(yá)刷”,酒店系统(tǒng)就会收(shōu)到,服务员(yuán)很快就(jiù)会把牙刷送过来。这样的话,通过人(rén)工智能(néng)技术可以让物联网的(de)设备(bèi)变得更聪(cōng)明,而且真正可以使(shǐ)得照明、空(kōng)调(diào)等设备变(biàn)得互(hù)联互通,非常(cháng)好(hǎo)用。
我(wǒ)希望(wàng)机器人(rén)也好,音(yīn)箱也好(hǎo),都能跟各(gè)行各业合作,我们的本(běn)质(zhì)不是想做一个硬件,我们的本质还(hái)是想做(zuò)一个AI赋能的云端操作系(xì)统,跟开发(fā)者一起做更多的(de)物联(lián)网设备。谢谢大家!