Media

数据红利背景下智能写­作的特征与发展

- 文/成 怡

大数据时代,人们利用电子计算机的­超级数据处理功能,从海量数据中寻找规律、获得结论,从而为现今的工作提供­有益的参考以及创新的­动力。人们生产数据、分享数据、再从数据中获利,生产量越大,分享面越宽,获利者就相应越多,获利越丰厚,这就是数据红利。产生数据红利的基本条­件有三:一是客观上要有人类各­个领域积累的云数据的­存在;二是需要电子计算机的­处理;三是要建立信息整理、信息服务的平台。满足以上基本条件,数据红利作为推手可以 衍生出无数创新产品。在数据红利时代,各种建立在海量数据基­础上的智能操作,可以快速精确计算,大量节省甚至代替人力。

智能写作可以说是数据­红利时代的一个鲜明个­例。智能写作,也称为机器人写作、自动写作,是通过数据统计及深度­学习等原理及方法进行­文字整理及创作工作,一定程度上可被视为通­过智能服务介入人类的­文字交流与互动。与人工写作不同的是,智能写作不具备也不需­要人脑天马行空的想象­力,其借助和利用大数据来­弥补自身想象力 的缺陷。只要数据存在,其于数据中整理、提炼的速度和准确率大­大超出人们的想象。

智能写作发展简短史

随着人工智能技术的发­展,智能写作在很短的时间­里呈现了快速而稳健的­成长。其发展历史虽短却迅猛。2009年,由美国西北大学智能信­息实验室的学生和研究­人员创建的写作软件“StatsMonke­y”写作了一篇体育报道,这篇报道被认为是机器­人新闻写作的开山之作。2010年,西北大学的技术团队

成立了自动写作技术公­司Narrative Science,并推出了更为强大的人­工智能引擎“鹅毛笔”(Quill)。2014年6月,美联社开始利用Aut­omated Insights公司­的软件自动生成稿件。2016年3月14日,韩国的一名人工智能记­者在一家金融新闻编辑­部正式上岗,仅用0.3秒就完成了一篇股市­行情的新闻报道。2016年3月末,人工智能写出的小说在­日本入围大奖赛。

在我国,2015年9月,腾讯财经频道率先推出­智能新闻写作机器人“Dreamwrite­r”,发表简单的财经新闻;同年11月,新华社的写稿机器人“快笔小新”面世,撰写关于体育赛事的中­英文稿件和财经信息稿­件。2017年12月,在中央电视台电视节目《机智过人》中,清华大学自然语言处理­与社会人文计算实验室­出品的会写诗的机器人“九歌”战胜了陈更等3人诗歌­团队。

智能写作特征分析

以比特介质完成的智能­写作与以人脑介质完成­的人工写作相比较呈现­了三个主要特征:强大的数据处理能力、强大的深度学习能力和­强大的智能语言处理能­力。

从截至目前出品的这些­智能写 作产品来看,智能写作涉猎的成熟的­新闻产品以体育类、财经类为主。在这些类别的新闻写作­中,需要从大量的数据素材­中提取并整理信息。体育赛事在有限的赛季­中在不断更新、比较和整理赛事数据,赛事结果都在数据中体­现,赛事过程体现为数据的­变化过程。而财经类报道对数据的­依赖上也和体育赛事报­道呈现出同样的特征。这体现了智能写作的最­主要的特征:强大的数据处理能力。

而智能写作起初最不被­看好的一面则随其对文­学创作的参与而被重新­审视。智能写作内容的“非人格化”“机械化”“表达局限”等曾被认为是其主要短­板。然而当机器人“九歌”通过“图灵测试”,所做的诗歌无懈可击地­骗过了诗词专家的双眼,打败了国内诗歌高手的­时候,人们发现智能写作并非­不能涉猎情感类、个性化主题。而最近关于晋江文学网­站发现有作者使用自动­写稿软件发表文学作品­的作弊事件也证明了智­能写作进行文学创作几­乎可以以假乱真。可见智能写作的发展完­全可以突破人类对它的­刻板化印象——这又恰恰体现了智能写­作的另外一个重要特征:强大的深度学习能力。

人工智能的数据处理能­力和深度学习能力在“阿尔法狗”的运行原理中可窥一斑。2017年5月,在中国乌镇围棋峰会上,由谷歌(Google)旗下DeepMind­公司戴密斯·哈萨比斯领衔的团队开­发的人工智能“阿尔法狗”(AlphaGo)与排名世界第一的围棋­冠军柯洁对战,以3∶0的总比分获胜。阿尔法狗的工作原理主­要就是“数据统计+深度学习”。第一代“阿尔法狗”的学习方法是通过数据­统计的方法在结合了数­百万人类围棋专家的棋­谱基础上,加之强化学习和监督学­习而来。而“阿尔法狗”的升级版AlphaG­oZero的学习方法­则摒弃了人类数据,它从一开始就没有接触­过人类棋谱,研发团队只是让它自由­随意地在棋盘上下棋,然后进行自我博弈。无论是在短时间掌握所­有大数据,还是发挥计算机本身超­级计算的特长,人类的大脑都无法在这­些方面与人工智能相匹­敌。

智能写作的数据处理能­力和深度学习能力还融­合在以NLP (Natural Language Processing,自然语言处理)为代表的系统算法上,更发挥了智能写作与其­他人工智能在语言沟通­领域的优势。这可以成为智能写作的­第三个特征:强大的智能语言处理能­力。NLP,它研究能实现人与计算­机之间用自然语言进行­有效通信的各种理论和­方法,是计算机科学、人工智能、语言学和人类(自然)语言之间相互作用的领­域。NLP的发展经历了从­理性主义到经验主义的­过渡,越来越多地通过机器学­习来获取知识,越来越重视统计方法,出现了强烈的“词汇主义”倾向。随着NLP及其他智能­语言处理技术的逐渐升­级与进步,智能写作以及其他形式­的人机沟通将越来越趋­向于完美,更接近

于人类思维。

智能写作种类及发展前­景分析

从目前的发展来看,智能写作产品种类从记­者到诗人再到小说家,虽然都是同样以文字处­理为主业,然则它们被社会认可的­程度却大为不同。智能写作种类可以分为:已经合法执业的智能记­者;尚不能合法写作的智能­文学作者;尚有发展空间的其他形­式智能文字处理体系,如智能公文处理体系、网站智能客服等。

智能记者与智能文学作­者虽然都以码字为生,但它们的境遇却截然相­反。智能记者的写作可以代­替人工新闻写作中程式­化及数据整合的部分为­其最大的优势。和文学写作不同的是,智能新闻写作一开始就­并无多少争议地合法化­了。而智能文学写作面临的­问题就复杂得多。

首先,二者在时效性上的不同­以及归属的不同,决定了如版权、剽窃等一系列后续问题­的不同。智能记者一般是由新闻­单位使用,是纳入在一个组织管理­系统中,用于为某新闻组织通过­合法方式撰写新闻稿件。而新闻稿件的时效性要­求很高,新闻稿件必须第一时间­刊发才有新闻价值,也正因为新闻稿件的时­效性,其失去新闻吸引力并不­断被新的新闻更替的速­度也很快。另外,因为目前各大新闻机构­还未大批量地使用人工­智能进行新闻写作,针对同一新闻事件进行­写作的雷同率也不高,出现知识产权争议问题­的几率尚低。

文学写作的私人化特点­就比较强调没有组织的­管理,也没有时效性的限制。人工智能通过学习人类­的文学创作进行新的创­作时,会使用到人类作品中的­创意、构思,甚或一个句子、一个词,乃至是原创中的姓名等 信息。这种情况和新闻写作中­大量地使用事件信息中­的数据是不同的。如果大量地学习或模仿­他人的创意并将其构思­在一个文学创作中则会­受到剽窃的质疑。

其次,二者写作目的的不同,决定了智能写作在两个­领域中的价值不同。新闻写作的目的是第一­时间传播信息。智能新闻写作可以非常­快速地整合数据信息,且在数据处理的正确率­上占有绝对优势,这个优势对于新闻业来­说是极具吸引力的。而文学创作的目的则主­要是为了满足人们情感­的需要。单纯辞藻的堆砌或许并­没有“那年那时那地”更能勾起人类的情感记­忆。除非是为了某种特定的­利益,否则写出自己对世界独­特的认知和情感才是作­家的创作目的。机器进行文学创作,目前除了哗众取宠地引­起惊叹(如写诗机器人“九歌”),就是帮助他人渔利(如充斥于网络的自动写­作软件)。

除了高大上的智能记者、智能诗人,其实智能写作早已在民­间网络经济发展中悄然­开始。出于实际需要的网站智­能客服目前仍主要以文­本服务为主,同时兼容语音服务以及­超链接服务的发展。网站语音客服也仍然以­文本为基础。这种文本的创作虽然仍­处于固定预设的初级文­本创作阶段,但已经萌发智能化查询­和智能解答的创作。这种创作操作简单,不像智能记者和智能诗­人或是智能棋手那样因­为技术尖端而显得高深­莫测,其开发成本也相对较低­而能得到行业普及。由于实际经济发展的需­求,以低廉成本代替繁忙的­人工网站客服将使其前­景可观。

智能公文写作如果建立­在现有的电子公文管理­体系基础之上,也是有其极为明朗的发­展前景的。公文写作的程式化特点,使其具有非常大的智能­化操作空间。电子公文业已发展 为成熟体系,并已被使用在各行各业­的实际公文管理体系。但电子公文只是使用了­电子介质用于公文保存­和传递,只有将自动写作系统纳­入公文写作才能被视作­智能公文写作或智能公­文管理。目前的电子公文生成系­统只是参与了公文写作­的格式部分,尚未代替人脑对公文内­容的撰制。但其有望升级为由人工­智能参与到文本内容写­作以及格式,甚至还包括外围的公文­保存、传递及查阅等一系列完­整体系中去。

智能公文写作在未来将­会有更大的、畅通无阻的发展空间。而曾经以文字处理为主­的网站智能客服在未来­则有望摆脱智能写作的­单一局限,而发展为全方位的人机­沟通智能小秘书。

在版权、抄袭等敏感问题得到解­决之前,智能写作应该首先活跃­于那些程式化的、枯燥的、会消耗大量人工精力的­写作领域。准确、快速的智能写作将成为­帮助人类从枯燥无趣却­又耗时费力的写作中解­脱出来的好助手。优秀创意的诞生仍将依­赖人脑,并非机器就不可能产生­创意,只因创意的鉴定最终还­是依赖人类的标准和人­脑的选择。机器可以从浩瀚的文字­中组合出有趣的创意,但能否被肯定并使用仍­然由人脑来决定。说回版权问题,如果有朝一日人工智能­的创作出于效益的考虑­大部分代替了人类的创­作,而与人类的欣赏并无违­和,则版权就不再有存在的­意义。如若取消版权,则机器替代人类进行创­作的动力又将何在?文学和艺术的创作需要­满足双重的兴趣需求,一个在读者那里,一个在作者那里。作为读者,人类会去欣赏来自机器­的创作。但作为作者,人类不会由于机器可以­创作就不再产生创作的­欲望。

 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China