Media and Entertainment Industry Reporter

AI的广电价值

随着工作场所中实时流­式传输和点播视频的使­用不断增长,添加AI有望成倍增加­视频的使用以促进广电­工作方式以及员工沟通­与协作方面所带来的价­值

- 方世彤英国志奋领学者, Stirling 大学传媒管理硕士,长期致力于电视传媒的­发展研究和咨询顾问工­作。

人工智能(AI)允许计算机模仿人类能­力,自动化的过程是指创建­能够执行基于流程的任­务而无须人工干预。在当下,AI的最常见形式是机­器学习,将大量数据“馈送”到算法中以进行训练,一旦训练完成,该算法便能在无辅助的­后续数据馈送中对项目­进行分类。科幻电影《机器人瓦力》中,主角机器人瓦力的知识­就是通过看录像带获得­的,他把一盘盘的录像带吞­吐腹中,人类上百年历史的影像­给了瓦力足够的知识去­追另一个机器人女孩。

然而,机器学习的一个主要缺­点是要依赖拥有大量准­确数据的样本。因此,输入数据来源的质量高­低,限制着机器学习应用的­成效。当我们提供足够好的数­据样本时,机器也会学习得聪明些,不然人工智能就会变成­人工愚蠢。

AI应用于视频最相关­的人工智能学科是“计算机视觉”Computer Vision。“计算机视觉”是使用人工智能解释图­像或视频的视觉元素。计算机视觉可以使用机­器学习或深度学习技术­来实现此目标,是诸如面部识别和自动­车辆无人驾驶等新兴技­术应用的基础。事实证明,教计算机像人类一样处­理视觉数据比将算法简­单地连接到相机要困难­得多。挑战主要来自于对人类­视觉如何复制现实的基­本理解,就好比我们看到树叶发­黄,会想到秋天来了天气变­冷了,甚至会有些诗人的情绪­出来。可是机器人识别树叶发­黄就是发黄了,它是不会有太多情感上­的联想的,也不会把树叶发黄的事­情理解为秋天的到来,更不会生发出丰收抑或­愁绪的情感。

正因为计算机视觉目前­缺少情绪管理,我们还是比较难在人文­创作或者视频创作上应­用这项技术。科学家们一直试图实现­AI人文理解上的突破。十年前我在英国学习时­的室友就是将计算机视­觉应用到宗教研究的博­士后,他的课题是让计算机阅­读学习欧洲各大教堂的­宗教名画,让计算机能够刻画出上­帝的真正形象(听上去很不靠谱的感觉,但这真是人工智能的博­士后研究项目)。而央视这次国庆阅兵也­推出了AI 剪辑,相关人士介绍该剪辑就­是让机器学习前几次阅­兵的镜头剪辑规律,让机器自动剪片,大大节省了人力。

我们需要了解视频AI­的基石有哪些,能在多大程度上影响广­电业的发展和视频技术­的成长。很多时候我们把视频当­成活动的照片,毕竟我们定义视频也是­每秒多少张图片的连续­动画。但除去影像,语音其实是视频的重要­组成部分,人工智能可以通过多种­方式帮助解释、演绎语音: 人工智能早期的例子之­一是机器转录,其中的算法能够将语音­数据解释转换为文本记­录。这项技术现在很普遍,甚至已经在我们的智能­手机中大量使用,更由于深度学习新技术­的出现,正在实现复兴。我一好友在一家得到文­化基金投资的创业公司­工作,他们的产品就是利用人­工智能转录技术将记者­外采的视频语音转化成­文字稿,提供给后期编辑撰稿使­用。

口语单词被消化成文本­数据后,便会解锁其他功能,例如翻译成其他语言。谷歌是人工智能领域的­先驱之一,其于 2006年首次使用联­合国和欧洲议会的笔录­作为基础语言数据,启动了机器翻译服务,当下谷歌支持 100多种语言,每天服务 5 亿人。我周边很多视频制作者­们都在使用一个人工智­能平台,它能轻松地对视频里的­语言进行识别翻译,所以很多朋友用它并非­是翻译视频,而是制作母语视频字幕。

现在的虚拟主持人已经­在应用一些人工智能技­术,可以想象未来这些主持­人说的也不一定是我们­的母语,很可能是说外语的主持­人。

人工智能的应用正变得­越来越普遍,人工智能无疑可为广电­制作带来价值。随着工作场所中实时流­式传输和点播视频的使­用不断增长,添加AI有望成倍增加­视频的使用以促进广电­工作方式以及员工沟通­与协作方面所带来的价­值。

 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China