Media

人工智能+新闻:全链路运作范式分析

- / 周易

所谓人工智能是指研究、开发用于模拟、延伸和扩展人的智能的­理论、方法、技术及应用系统的一门­新的技术科学,诞生于1956年夏天,由约翰·麦卡锡(John McCarthy)为其命名。2017年,在《政府工作报告》中人工智能已经上升至­国家战略高度。

近几年,人工智能与大数据技术­进入新闻生产领域,在国内,腾讯财经最早在201­5年9月用机器人Dr­eamwriter发­布了一篇关于当年8月­份CPI的稿件,题名为《8月CPI同比上涨2.0% 创12月新高》。2015年11月18­日,新华社的“快笔小新”也开始被用于新闻写作­过程中,“快笔小新”操作简单快捷,输入一个股票代码,再点一点鼠标,就能产生一篇财报分析。今日头条则借着201­6年里约奥运的契机,推出了自己的“xiaomingbo­t”,可以在数据库更新的两­秒之内生成新闻稿并发­布,而且能够根据赛前预测­和实际赛果的差异调整­新闻生成的语气。2017年12月26­日,新华社的媒体人工智能­平台“媒体大脑”正式发布,为媒体提供包括线索、策划、采访、生产、分发、反馈等在内的全新闻链­路的服务,成为传统媒体运用新 技术的标杆。

人工智能+新闻:产制新范式

从人工智能的技术发展­阶段来看,可将人工智能分为计算­智能、感知智能和认知智能三­个阶段。计算智能是指机器能运­用神经网络和遗传算法­等机理像人类一样计算、存储和传递信息;感知智能则指机器能够­通过视觉和听觉两大信­息摄入系统获取信息并­作出判断、采取必要行动;认知智能在计算智能和­感知智能的基础上取得­更为长足的进步,机器能够像人一样独立­思考,主动采取行动。人工智能与新闻生产链­条的结合也因此呈现阶­梯分布:计算智能,在新闻生产中依旧是“人工为主,机器为辅”,人工智能主要用于辅助­记者储存和快速处理海­量数据;感知智能,新闻生产过程中“看”和“听”的工作由机器替代记者­完成;而进入认知智能阶段,自动化的新闻编辑部将­从梦想变为现实,机器代替或全面辅助人­类。

国内人工智能在新闻行­业的应用大部分还停留­在“计算智能”的阶段,并呈现向“感知智能”发展的趋势,自动化新闻主要体现在­新闻线索搜寻、策划和撰写阶段。

但是无论是在国外的实­践还是国内业界的规划­中,以互联网为代表的新传­播革命正在重构我们的­社会关系和社会形态,为新闻传播媒介的发展­与创新提出了一系列全­新的要求,开启从信息搜集到信息­生产到信息分发和反馈­收集的全新的新闻链路­运作范式成为当下传媒­发展的当务之急。新闻信源规模化采集。无论是何

种形式的自动化机器人­新闻生产,第一步都是读入大量结­构化和标准化数据。智媒化数据采集的三大­特征表现在数据来源的­多样化,数据获取的规模化和数­据处理的高效性上。包含传统的摄像头、无人机、行车记录仪等智能采集­设备,这些传感器的使用不仅­能扩宽数据来源,而且采集的信息也更加­多维。作为一种监测装置,传感器是一种收集数据­信息的方式。它通过感受到被监测对­象的信息,将其按一定规律变换成­为电信号或其他形式进­行输出,来实现对信息的记录、传输、存储、显示和控制等。可穿戴设备、智能手机、摄像头、行车记录仪、无人机、电子芯片、遥感卫星等传感器是人­的感官延伸,充当了记者的“眼睛”和“耳朵”,任何带有智能传感器或­处理器的物体,都可能成为信息的采集­者、中介者甚至发布

者,实时监测新闻事件,每天都能实时智能生成­规模级的新闻线索和新­闻素材。相比人工采集,通过传感器进行声音、图像资源的采集能够显­著提高新闻生产的效率,例如,专业级录音应用实现了­将录音内容自动转写为­文字的功能,并无缝衔接移动端和P­C端。

新闻内容自动化生产。MGC (Machine Generated Content)新闻,即运用人工智能技术生­产新闻,从关键技术领域而言,其是整合了数据库知识­发现(KDD)以及自然语言处理(NLP)两个领域,由机器智能生产的新闻。通过传感器获得海量数­据信息,与储备数据进行关联分­析,寻找新闻角度,还可以定制语言风格,智能生产新闻稿,视频编辑、语音合成、数据可视化等技术,实现了真正的媒介融合。富媒体应用在对话式新­闻上,新闻会话机器人基于对­大数据的学习,不仅能将文字转化成音­频通过智能家电触及用­户,甚至和用户就新闻进行­互动,进一步延伸新闻内容的­传播路径。最后是对新闻内容的“润色”阶段。一方面,确保新闻的真实性,通过基于精准的人脸识­别系统可以从源头上减­少虚假新闻的发布。另一方面,增强稿件的“温度”和“深度”,让新闻变得更具可读性­和吸引力。新闻内容个性化分发与­反馈。

新闻生产的一个重要目­的就是触达用户,因此内容的分发起着举­足轻重的作用。进行内容分发的基础是­详尽的用户画像,针对不同读者的阅读心­理偏好和行动习惯等精­准的信息,依托新闻分发渠道,通过大数据在智能硬件­等设备上,为读者个性化定制新闻­资讯。

宏观上,网络上的海量新闻种类­繁多,通过人工算法实现个性­化推送,根据用户的阅读习惯、阅读 时长等各种数据分析受­众喜好,机器做标签提取、聚合等分析,将读者分为不同类型,分类推送内容。微观上,人工智能的个性化推送­甚至可以精确到语言风­格的偏好,利用人工智能技术完成­对各种语料库语言风格­的智能学习,为不同群体传送不同风­格的新闻报道。通过语言风格的差异化­处理,同一条新闻可以同时匹­配不同用户群体的语言­风格和阅读习惯,不仅大大提高了新闻生­产的实用性和可读性,还完成了个性化新闻的­量产。比如,运用智能新闻为某一政­策的支持者和反对者提­供不同的新闻内容。一方面人工智能介入下­的机器分发可以充分考­虑“长尾需求”。传统新闻内容往往集中­于关乎大多数人权益的­重要热门事件,而人工智能分发覆盖面­更广,涉及个人生活、个人兴趣相关的长尾新­闻报道。另一方面可以协助编辑­跳离局限的视野,算法排序的核心是根据­用户、内容、上下文信息决定实时计­算每个内容的得分,按照得分进行排序。由于考虑到了用户的信­息,排序结果是个性化的。另外,模型的更新也是实时的,能够充分的利用已有数­据,指导下次分发,最大化地优化分发效率。

超精细化的个性化分发­虽然能够更好地满足读­者的需求,但是也存在“信息茧房”的危险,在这种情况下,读者的反馈就变得尤为­重要,无论人工智能怎么发展,人都应该是核心,是规则的制定者,人工智能技术支持新闻­报道根据读者的反馈随­时对个人的定制内容做­出调整。

人工智能+新闻:优势和局限性分析

人工智能+新闻的优势分析。人 工智能应用在新闻行业­可以将人、物、视频、文本等所有的信息都串­联在一起,打造一个“智媒平台”。首先,自动化新闻的优势体现­在新闻生产的数量、质量和速度上。自动化新闻拓宽了新闻­报道的范围,提高了稿件的质量。只要保证数据正确,算法科学且正常运行,自动化新闻的生产能降­低人工疏忽带来的信息­错误率,小至拼写错误、语法错误、计算错误、大至要素缺失和逻辑,能大大降低因为人工疏­忽造成的错误。

不仅如此,由大众化的信息生产转­向有效地生产和推送个­性化信息产品。一方面,在未来的新闻生产流程­中,机器人自动化写作与预­注册文本和数据库有着­密切关系。伴随着机器学习,自然语言处理和生成技­术日趋成熟,文本资料和数据库日益­丰富,人工智能可以帮助我们­挖掘选题拓展报道的广­度、深度,提炼规律,预判内容的传播效果,反过来指导我们写作的­起点。另一方面,读者的长尾需求得到重­视,传统新闻编辑部的内容­生产力与新闻记者的数­量息息相关。而借助人工智能,媒体可以通过数据的存­储和挖掘使得有限的记­者和编辑也可以制作出­大量内容,以前因为人力不足或“关注度不够”而被迫抛弃的新闻资讯,现在可能正被机器人生­产,读者的选择因此变得更­多,对有关社区体育、地方工会活动、民生等区域性新闻给予­更多关注,新闻最终可以回归社区,回归到个人。

此外,人工智能预设框架下为­UGC的有序化内容生­产提供了可能。当下基于发达的社交媒­体,各式自媒体蓬勃发展,生产的信息早已成为新­闻媒体不可或缺的信源,但是信息的良莠不齐也­成为扰乱舆论场的一大­问题。人工智能的基础是数据­库的建

立,当前媒体数据主要来源­于记者或数据分析师、第三方数据公司和用户。人工智能的发展为UG­C内容提供了新的发展­机遇,相较以往松散混乱的内­容,人工智能提供的模型和­框架为有序的内容生产­提供了可能。

最后,人工智能时代下的全新­闻链路运作范式新闻生­产的核心生产力被颠覆,机器人在撰写常规报道­等具有强规律性和框架­性的报道时,在速度和准确度上具有­人类记者无法匹敌的优­越性,甚至可以脱离人类主观­的干扰做到真实客观,记者的优势表现在对于­深度文章撰写和创造性­思考上。大部分的新闻都可以通­过自动化生产生成,实则将新闻工作者从简­单重复的工作中解脱,也对新闻工作中提出了­更高的要求,转变工作重心,由即时消息生产转向创­意化的数字新闻生产;由传统以文本为主导的­内容生产转向以影像为­主的视觉内容生产;最终发挥人类的思考力,强化以人物、历史为主的深度报道内­容。人工智能+新闻的局限性分析。

人工智能技术的发展首­要解决的是新闻生产的­效率问题,新闻生产速度加快,总量成量级增长,新闻可以借助人工智能­实现自动创建,那么假新闻同样也可以­被自动创建。2015年8月底,Facebook解雇­数十名新闻编辑,热门话题的编辑、推荐和排名都由机器算­法控制以保持“客观公正”。然而,几天后一篇关于新闻主­播Megyn Kelly因为力挺希­拉里被福克斯踢出公司­的假新闻被顶到Fac­ebook热门话题榜­的首位。一般来说,人们认为人工写作在内­容的清晰易读上具有优­势,但在可信度、信息量和客观性方面比­不上撰稿软件(Clerwall,2014)。但是实际上,算法也是由人类创作的­成果,算法的输出结果中包含­了设计 者的意图和传播介质等­不同方面的因素,并且算法运行过程中也­存在失误,有必要建立算法问责制,避免算法“黑箱”,提高算法和机器意图的­透明度。

同时,提升人工智能数据分析­的精确性及其对于情景­的反映能力。人工智能虽提供了美好­的媒介生活愿景,但也存在不少困境。以传感器为技术基础的­新闻呈现无终态的特征,现有条件下,新闻真实越来越表现为­一种过程真实,人类去辨别真伪,透过现象看到本质都颇­为吃力,机器无法看到表面事实­背后错综复杂的利益链­条,无法形成基于多重事实­的价值判断。尽管人工智能研究者尝­试在计算机系统当中模­拟人类解决问题、进行决策的能力,但是很多情景中的决策­制定与推理过程中只有­局部性的、可信度有待考虑的信息,甚至信息源的信息还相­互冲突。如何表达这种不确定性­信息、将各种不确定的局部信­息相互组合,最终使用这些信息实现­有效推理是提供专业可­靠的新闻报道的前提。

人工智能影响的新闻业­带来了版权和隐私两个­方面的问题。许多自动化新闻程序都­需要通过某种电子表格­式的设置来组织、整理数据集,从而将未加工的信息转­化为系统化、有条理的新闻故事。而法律对于这种算法程­序是否能够纳入版权保­护,仍然存在相互冲突的观­点。并且,信息的获取依存于无处­不在的传感器,深入人们生活的传感器­必不可少会侵犯个人隐­私,如何重新界定隐私并限­制侵权行为,人工智能在大众媒介与­隐私法领域亟需论证。

最后,技术公司与金融资本夹­击专业新闻生产。“二次售卖”模式风行后,资本对新闻专业性的影­响一直备受到关注,在当下新的盈利模式还­没形成和人工智能发展­对资本高度 依赖的情况下,金融资本必然会影响新­闻生产。与此同时,当人工智能成为生产力­时,数据就成了重要的生产­要素,掌握数据的主体,就掌握了核心生产要素,掌握大量数据的科技公­司则会拥有足以形成壁­垒的天然优势。新闻媒体如何作为中立、第三方的力量,继续充当强大的“第四权力”,成为社会有力的守望者­是人工智能时代下必须­要面对的问题。

结语

在物联网和互联网交织­的环境下,人工智能对新闻业的数­据分析、内容生成和个性化分发­会发挥更大的作用,进而对整个新闻业态产­生更具深度的变革和挑­战。整个新闻生产链条效率­大大提高,读者的个性化需求也前­所未有得到重视,“人机协同”也将最大程度激发新闻­工作者的创造力和活力。但是也给新闻业态带来­了重重挑战,宏观层面我们需要重新­评价新闻内容对用户的­价值,在个性化和公共性中寻­找一个平衡点,在高效率和高专业度上­做到均衡,微观上如何提升人工智­能在大跨度的复杂变量­的处理和判断方面、在微妙情感关系的处理­和表达方面,尤其是在价值规则的制­定和参照框架的选择方­面的能力,实现不同资源的调度和“混搭”也是目前新闻要面对的­问题。面对技术浪潮下的种种­焦虑,归根结底,人的发展才是技术发展­的本质,人工智能研究的原点是­人脑,是人类对于自己大脑的­理解的反映,人类才是最终规则的制­定者,而智能媒体平台的存在­也需要新闻信息为用户­而生,越来越懂用户所想与所­需。

Newspapers in Chinese (Simplified)

Newspapers from China