少女野外调教 东谈主工智能时候在智能裁剪方面的应用

发布日期:2024-10-13 13:06    点击次数:64

少女野外调教 东谈主工智能时候在智能裁剪方面的应用

  【编者按】第二届新视听媒体交融创新创意大赛以“创意点亮梦念念 交融创举改日”为主题,赛程从9月握续到12月少女野外调教,分为启动、预赛、复赛、成果发布四个阶段,共成就“媒体交融时候创新”“媒体交融内容创新”“媒体交融模式创新”三个赛谈,旨在施展资源上风,加速股东媒体交融的时候创新、内容创新、模式创新。大赛由国度播送电视总局和中华世界新闻责任者协会教学,中共北京市委宣传部、光明日报社、北京市播送电视局、国度播送电视总局播送电视科学掂量院和北京市新闻责任者协会共同垄断。

  作家:林卫国(中国传媒大学 筹画机与收罗空间安全学院院长)

  东谈主工智能看成一门前沿交叉学科,与数学、筹画机科学、收尾科学、脑与判辨科学、谈话学等密切有关,该边界的掂量包括机器东谈主、谈话识别、图像识别、天然谈话处治和众人系统等,东谈主工智能的主要缱绻是使机器能够胜任一些平时需要东谈主类智能技艺完成的复杂责任。

  近十年来,跟着大数据、云筹画、互联网、物联网等信息时候的发展,图形处治器等筹画平台的推动,以神经收罗为代表的东谈主工智能时候马上发展,大幅跨越了科学与应用之间的时候“边界”,图像分类、语音识别、常识问答、东谈主机对弈、无东谈主驾驶等东谈主工智能时候迎来了爆发式增长的新高潮。天然通用东谈主工智能尚处于起步阶段,关联词东谈主工智能的社会影响仍辞谢小觑,在媒体边界也出现了智能交融发展的趋势。融媒体是将传统的电视、播送、报刊杂志等传统媒体与频年来新兴的公众号、短视频等新媒体互相整合,充分施展其传播价值的一种运营模式。看成科技发展的居品,融媒体要充分独揽东谈主工智能,竣事媒体深度交融发展。在开启东谈主工智能3.0的今天,东谈主工智能的发展照旧融入到了日常新闻媒体的创作之中。

  东谈主工智能应用于媒体交融边界主要有东谈主脸识别、场景识别、缱绻检测、视频分割、缱绻跟踪等算法,成绩于深度学习算法的打破、算力的不断进步以及海量数据的握续积聚,东谈主工智能真刚直范围地从实验室掂量走向产业履行,催生出了一大量本体应用。底下先容几种具体应用。

  面前,各大视频网站接踵推出了识别视频中东谈主物以及只看某东谈主功能,如图1、图2所示。用户在不雅看视频时,不错凭证需要识别到视频帧中的东谈主物、不雅看特定演员的片断。这主要用到了东谈主工智能边界的东谈主脸识别等算法。东谈主脸识别算法是一种建立生物特征东谈主脸模子以供进一步分析、识别的圭表,是任何东谈主脸检测和识别系统的基础组件。如图3所示,基于深度学习的东谈主脸识别经过主要包括东谈主脸预处治 (检测、对皆、标准化、数据增强等)、特征学习、特征比平等门径,其中特征学习是东谈主脸识别的关节,何如索求强判别性、强鲁棒性的特征是东谈主脸识别的掂量重心。视频平台通过检测视频流中的东谈主脸数据,索求东谈主脸的特征信息,构建东谈主脸三维模子,将模子与考试集进行比对以识别某东谈主。

descript

  图1 识别东谈主物

descript

  图2 只看某东谈主功能

descript

  图3 基于深度学习的东谈主脸识别考试经过

    独揽视频内容和会时候,东谈主工智能算法通过分析视频的质地、视频的精彩进度以及内容有关度,基于对视频的丰富和会,索求视频中最具代表性的某一帧图片或者某几秒的片断看成视频封面,如图4所示。用户不错借此快速定位缱绻视频,既提高了视频点击率,又给用户细密的搜索体验。视频内容和会波及到许多方面,时时需要针对场景和东谈主物步履进行皆集特征的索求、构建。关于一个视频,领先需要每隔一定秒数来抽取一些关节帧,通过肤浅的打分模子来判断视频帧的质地。接着,考取一些质地分相比高的图片看成候选封面,并对候选封面进行详备的分析,包括东谈主脸、东谈主体的检测,主体物体的识别、图片质地分析、明晰度打分等。临了,针对统共信息进行特征交融,把封面考取问题建模成一个排序问题来判断统共帧的质地,并通过智能裁剪的边幅对关节部位进行检测和截取,来看成最终的视频封面。

descript

  图4 平台援助封面聘任

      传统的视频裁剪,经过相对复杂,需要裁剪师老练举座素材,又包括素材的筛选分类、场景的拼接裁剪、基于氛围节拍精采退换、添加配乐、殊效、转场、字幕等诸多经过,是一件门槛既高又耗时冗忙的事情。智能裁剪主淌若独揽东谈主工智能的学习技艺。在学习并和会了镜头谈话后,东谈主工智能算法不错凭证文本对视频进行裁剪。在此基础上制定相应的裁剪轨则,渐渐去完善机器自动进行镜头拼接的技艺。借助东谈主工智能援助专科东谈主员进行快速裁剪,机器先快速完成粗剪之后再交由专科东谈主员进行精剪。与此同期,一些肤浅的镜头也不错交给算法自动完成。举例在一个真东谈主秀节目中,同期有几十个机位在同期录制,前期从这样多素材中快速找到最终裁剪需要的镜头就不错通过东谈主工智能来进行筛选,以节俭时代。因此借助特定的算法,一段素材中的高质地片断不错被迅速识别出来供用户进行合理剪裁。算法还不错对素材内容进行分析,凭证素材的场景,推选给用户符合的配乐、转场殊效和页面避开。现时许多短视频平台都提供了智能裁剪功能,用户不错凭证模板苟且裁剪视频、制作卡点音乐、添加殊效,如图5所示。东谈主工智能应用于视频裁剪边界,不错迅速提高行业坐褥力,使裁剪的经过变得标准化、智能化、肤浅化。视频裁剪不再专属于少数专科东谈主士,操作经过的便捷与流通,会让越来越多的东谈主不错参与进来。

descript

  图5 独揽模板智能裁剪

  此前用户不错通过输入肤浅的文本内容,借助东谈主工智能算法生成艺术插画。近期,Meta(原Facebook)和Google接踵推出文本生成视频的算法。Meta的Make-A-Video不错凭证用户输入的形貌某个场景的文本信息,生成一个相匹配的短视频。Google提议的Imagen Video比Make-A-Video有更高的分袂率,不错生成每秒24帧、1280*760分袂率的视频。输入泰迪熊洗碗,Imagen Video会生成如图6所示的场景。Google提议的另一个算法Phenaki,能凭证200个词驾驭的请示语生成2分钟以上的长镜头,评释一个竣工的故事。跟着文本生成视频时候的快速发展,改日,各大短视频平台的视频大致不再是真东谈主扮演秀,而是合成视频的舞台,这将给视频裁剪和录制的责任主谈主员带来机遇与挑战。

descript

  图6 泰迪熊洗碗

  跟着深度学习尤其是神经收罗的发展,视频换脸、合谚语音、影像确立、假造数字东谈主等越来越平时地出当今酬酢文娱、影视制作、教育、告白营销等边界,发展出多元化的营业应用,如图7、8、9所示。这些应用的背后,是以深度合成时候为代表的东谈主工智能算法在施展作用。神经收罗中有一类主要用于生成任务的生成起义收罗GAN,由于其不错生成绝顶传神的图像,从而繁衍出一系列图片及视频合成算法。在改日深度合成时候会更多地应用于影视、文娱、教育、酬酢、电商、医疗、科研等诸多边界。除面部的编订外,深度合成的范围也会进一步扩大。东谈主物全身的合成以及场景的合成会是下一步的掂量趋势。时候的应用时时是一把双刃剑。在深度合成时候不断自在越来越多需求的同期,部分坏心应用也运行引起等闲关爱。其中危害最大的一类即是更换东谈主脸的伪造视频,将一个东谈主的脸或激情替换到另一个东谈主的脸上,从而生成确切度极高的视频,此类时候足以给社会结识及个东谈主名誉带来严重胁迫。面前国表里学者从多样角度掂量何如辩别伪造视频,提议了许多算法。举例从东谈主脸固有特征启航检测真假东谈主脸生理特征的算法;勾通图良晌序信息、频域印迹的算法;基于特定东谈主脸身份信息的算法等等。面前的鉴伪算法照旧有了相比高的准确率,泛化性上也在渐渐提高。是以深度合成时候不会因为深度伪造停驻脚步,详细性的视听合成时候必将深刻转换视频行业的改日。

影像确立

  图7 影像确立

数字东谈主

  图8 仿真撒贝宁智能主播

东谈主工智能时候在智能裁剪方面的应用

在线看三级片

  图9 深度合成应用场景

  东谈主工智能时候是引颈科技改进和产业变革的战术性时候,对经济发展、社会向上、外洋政事经济花式等方面产生漏洞而真切的影响。现时我国的东谈主工智能时候发展态势细密,同期也要强硬到竣事自主智能和通用智能仍然需要中始终表面和时候积聚,感性分析东谈主工智能发展需求,深刻和会东谈主工智能边界基础表面和共性关节撑握时候发展趋势,更好地将东谈主工智能时候与融媒体产业勾通发展,能够推动统共这个词播送电视、媒体行业从数字化、收罗化向智能化发展,推动行业转型升级,构建贤慧媒体新业态。

  第二届新视听媒体交融创新创意大赛参与边幅

  登录光明网首页,点击第二届新视听媒体交融创新创意大赛官网,浏览了解大赛防护信息。

东谈主工智能时候在智能裁剪方面的应用少女野外调教



热点资讯

相关资讯

Powered by 雨宫琴音作品 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024