随着互联网直播兴(xìng)起,各类平台想(xiǎng)要做(zuò)出一档可看且互动性(xìng)强的直(zhí)播节目(mù),除了要精心编(biān)排(pái)节目内容,还要重视音(yīn)视(shì)频及互(hù)动方式的呈现。5G时代的到来,也使视频的内容和(hé)展现形式(shì)呈现更加多元化,一(yī)部无(wú)压缩的蓝光电影(yǐng)大(dà)约25G左右,用移动网络在一分钟不到(dào)的时(shí)间即可下(xià)载完成(chéng),视频作(zuò)为信息传输介质的通讯阻碍已经可以基本排除。同(tóng)时在直播、点播等基础场景上,也增加(jiā)了短视频和(hé)实时音(yīn)视频互动的新浪潮(cháo),同(tóng)时视频技术也在安防、医(yī)疗、教育(yù)、文娱、广电等领(lǐng)域有着全新的应用(yòng)。
portant;" />
互联网时代下,人们获取知识的途径越来越多(duō)元化,所获取的知识(shí)也呈现出(chū)碎片化的趋势。如(rú)何正(zhèng)确(què)利(lì)用互(hù)联(lián)网(wǎng)来提高自(zì)己(jǐ)获取知(zhī)识的效率,已经成为了当下互(hù)联网市场需要(yào)考虑的重点。视频作为(wéi)5G时代(dài)下受益(yì)的方(fāng)向,也受(shòu)到了(le)越来越多企业的关注。在这样的市场(chǎng)环境和视频技术发展(zhǎn)的(de)双驱动下,极(jí)链科技Video++作为「AI+视频」行业独角兽企(qǐ)业,建(jiàn)立了以5G+AI推动的视(shì)频作为信息和功能核心载体的新互(hù)联网形态-视联网。
视联网,是以视频(pín)作(zuò)为主要信息传递介质和功能载体的(de)下一代互联网形态,颠覆了(le)当(dāng)前图文(wén)生态的互联(lián)网形态(tài),引发新一轮互(hù)联网生态的激烈竞争(zhēng)。而要实(shí)现(xiàn)视联网,需要突破(pò)通(tōng)讯带宽(kuān)、视频(pín)识别和视频互动等三个方面的难点。而5G的(de)普及以(yǐ)及AI技术的突破(pò)将是解决(jué)这三个难点(diǎn)的重要抓手。
在视联网的起点,人们(men)刚刚学会(huì)如何利(lì)用AI技术打破视频的信息壁,并能够利(lì)用(yòng)视(shì)频信息(xī)进(jìn)行初步的商业应用。在这一阶(jiē)段中,对于视频信息的解读和利用(yòng)是比较有限(xiàn)的,表现为(wéi)数据维度(dù)较少、可辨识的类别(bié)有限。这主要是受限于视(shì)频数(shù)据的数据量和标识量。
当前以深度(dù)学习神经网络算法为主(zhǔ)流的AI技术需要大(dà)量经过标识的数(shù)据样本作为训练AI算法(fǎ)的(de)养料。通常,计算机要达到可商用的(de)识别能力,需要(yào)上百个(gè)差(chà)异化的数据样本的反复调(diào)试。但(dàn)数据的标识和算法的(de)训(xùn)练需要大量的人力投入,同时(shí)视(shì)频内容(róng)的版权(quán)和信息安全问题也制约(yuē)了视频数据的传播。人力(lì)与数据共同限(xiàn)制着视频识别能力的提升。
portant;" />
为了尽可能的利用识别出的有(yǒu)限信息(xī),初期(qī)的视联(lián)网应用(yòng)表现出了典型的“预期-推送”模(mó)式。在这一模式中,本质上(shàng)是利(lì)用外部(bù)已有的(de)用户大数据和行为心理学对视频观(guān)众的心(xīn)态和行(háng)为进(jìn)行预测,挑选出被认为能引(yǐn)起(qǐ)观众共(gòng)鸣(míng)的场(chǎng)景。进而,集(jí)中人力和数(shù)据(jù)让计算机学会识(shí)别这些场景,并(bìng)在全(quán)网视(shì)频中找出此类场景中,推送(sòng)与之相关的(de)应用(yòng)服务(wù)。例(lì)如,针对视频中的团队聚餐事件(jiàn),可以分为(wéi)提(tí)出聚(jù)餐、进入餐厅、点菜(cài)、吃的热火朝天和结账等五个(gè)场(chǎng)景。通过数据分析和(hé)常识判(pàn)断,吃的热火朝天的场景能(néng)引(yǐn)起人们对吃的情感(gǎn)共鸣,这时(shí)候就可以集中资(zī)源让计算机学会识别“吃的热(rè)火朝天”场景,进而在此类场景中大规模自动化地(dì)推(tuī)送(sòng)与吃相关的应用服务。
基于“预期(qī)-推送”模式,视联网的早期参(cān)与者(zhě)开发出了广告和(hé)电(diàn)商两类应用模式。这两(liǎng)者(zhě)相对于其他互联网服务而(ér)言,具有商(shāng)业模式较轻(qīng)、变现速度较快的特点,并且对于(yú)视频场景(jǐng)的需求(qiú)也较为明确。
portant;" />
视频(pín)的高带宽使其不仅能(néng)传递语言和图文(wén)能够表(biǎo)达的明示信息(xī),更能传递其他形式较难表达(dá)的默会信息(xī),例如人的情感。人与人面对面的交流要比单纯的(de)电(diàn)话交流更能了(le)解(jiě)一个人(rén)的精神状态,就是因为人的视觉能够接收到的(de)信息要远大于通过(guò)语言(yán)表达接收(shōu)到的信息,例如表情、动作(zuò)等,从(cóng)而分析出对面人所表现出的情感。视频也是(shì)如(rú)此(cǐ),通过视频能够更为便(biàn)利的实(shí)现不同时空的人与人的情感交流。视频这(zhè)一特点已被广泛应用,影视剧(jù)作(zuò)之所以吸引人(rén),是(shì)因为其沉(chén)浸感和代入感(gǎn)更能引起人的情感(gǎn)共鸣。越来越多的企业采用网络(luò)视频形式传播企业形象,也是为了通过视(shì)频传递的情感交流建立与观(guān)看(kàn)者(zhě)的(de)信任感,树立品牌形象。目前,视频内(nèi)容已经占据(jù)了互联(lián)网数据(jù)总量的80%,并且有越来(lái)越多的APP开始(shǐ)加载视频功能。即便没有任何技术与应用突破,预计到2022年视频内容的数据总(zǒng)量也将达到82%。这都表明视频在促进人与人交互(hù)中的作用得到了广泛(fàn)的认可(kě)。
广告业(yè)务的基本形式在于视频场景与广告内涵的匹配。通过解析(xī)视频内容(róng)中蕴含的人物、物体、动作、地标等信(xìn)息,可以寻(xún)找到与广告(gào)品牌内涵相(xiàng)一致的视频场(chǎng)景,进(jìn)而实现广(guǎng)告品牌价值与视频(pín)内容场景(jǐng)相互匹配。这种(zhǒng)模式(shì)下,可以创造出视频场(chǎng)景广告这一全新的广告形式(shì),大幅提高广告曝光(guāng)的接受度和回报率。
portant;" />
随着5G技术的到来,技(jì)术的发(fā)展将带来更多的便利。在视联(lián)网的(de)成熟期,人们将(jiāng)可以借助可穿戴智能设备,例如智能眼镜等,捕捉所见的一切信息,并在极短的时间(jiān)内处理成(chéng)计算机可以识别的(de)视频信息。人们从视觉信息(xī)中激(jī)发(fā)的需求(qiú)都可以即时的得到响应。通过(guò)语言、手势、眼动(dòng)捕捉等(děng)多种形式,计算机能够接收到人们提出的需求(qiú),并结合捕捉到的视频信息(xī)获悉需求(qiú)的具体(tǐ)内容和对象,进而调(diào)用互联网的相关应用和(hé)服务来(lái)满足人(rén)的需求。最终以一种便利的交互方式(shì),将应用(yòng)和服务反(fǎn)馈在(zài)人机交互的虚拟层上(shàng),形成未来视联网(wǎng)发展(zhǎn)的成熟模式。
成熟(shú)阶段的视联网是(shì)互联网服务与(yǔ)视频内容高度结(jié)合,这一时期,互联网中的各类服务和应用(yòng),也将以小程序的形式全方位(wèi)打通视频内容。链接(jiē)互联(lián)网信息(xī)、服务、购物(wù)、社交、游戏五大模(mó)式,实(shí)现基于视频(pín)的新互联网经济(jì)体。
可以推测出,未来(lái)智能硬件与视联(lián)网将深度结合,人的视觉感官将成为互联(lián)网(wǎng)的入(rù)口,链接到几乎所有(yǒu)的互联网(wǎng)设(shè)备(bèi),享受其提供的服务。像互联网一样,融入到人们(men)生活的方方面面。