数据红利背景下智能写作的特征与发展

2018-08-15 - 文/成怡

大数据时代，人们利用电子计算机的超级数据处理功能，从海量数据中寻找规律、获得结论，从而为现今的工作提供有益的参考以及创新的动力。人们生产数据、分享数据、再从数据中获利，生产量越大，分享面越宽，获利者就相应越多，获利越丰厚，这就是数据红利。产生数据红利的基本条件有三：一是客观上要有人类各个领域积累的云数据的存在；二是需要电子计算机的处理；三是要建立信息整理、信息服务的平台。满足以上基本条件，数据红利作为推手可以衍生出无数创新产品。在数据红利时代，各种建立在海量数据基础上的智能操作，可以快速精确计算，大量节省甚至代替人力。

智能写作可以说是数据红利时代的一个鲜明个例。智能写作，也称为机器人写作、自动写作，是通过数据统计及深度学习等原理及方法进行文字整理及创作工作，一定程度上可被视为通过智能服务介入人类的文字交流与互动。与人工写作不同的是，智能写作不具备也不需要人脑天马行空的想象力，其借助和利用大数据来弥补自身想象力的缺陷。只要数据存在，其于数据中整理、提炼的速度和准确率大大超出人们的想象。

智能写作发展简短史

随着人工智能技术的发展，智能写作在很短的时间里呈现了快速而稳健的成长。其发展历史虽短却迅猛。2009年，由美国西北大学智能信息实验室的学生和研究人员创建的写作软件“StatsMonkey”写作了一篇体育报道，这篇报道被认为是机器人新闻写作的开山之作。2010年，西北大学的技术团队

成立了自动写作技术公司Narrative Science，并推出了更为强大的人工智能引擎“鹅毛笔”（Quill）。2014年6月，美联社开始利用Automated Insights公司的软件自动生成稿件。2016年3月14日，韩国的一名人工智能记者在一家金融新闻编辑部正式上岗，仅用0.3秒就完成了一篇股市行情的新闻报道。2016年3月末，人工智能写出的小说在日本入围大奖赛。

在我国，2015年9月，腾讯财经频道率先推出智能新闻写作机器人“Dreamwriter”，发表简单的财经新闻；同年11月，新华社的写稿机器人“快笔小新”面世，撰写关于体育赛事的中英文稿件和财经信息稿件。2017年12月，在中央电视台电视节目《机智过人》中，清华大学自然语言处理与社会人文计算实验室出品的会写诗的机器人“九歌”战胜了陈更等3人诗歌团队。

智能写作特征分析

以比特介质完成的智能写作与以人脑介质完成的人工写作相比较呈现了三个主要特征：强大的数据处理能力、强大的深度学习能力和强大的智能语言处理能力。

从截至目前出品的这些智能写作产品来看，智能写作涉猎的成熟的新闻产品以体育类、财经类为主。在这些类别的新闻写作中，需要从大量的数据素材中提取并整理信息。体育赛事在有限的赛季中在不断更新、比较和整理赛事数据，赛事结果都在数据中体现，赛事过程体现为数据的变化过程。而财经类报道对数据的依赖上也和体育赛事报道呈现出同样的特征。这体现了智能写作的最主要的特征：强大的数据处理能力。

而智能写作起初最不被看好的一面则随其对文学创作的参与而被重新审视。智能写作内容的“非人格化”“机械化”“表达局限”等曾被认为是其主要短板。然而当机器人“九歌”通过“图灵测试”，所做的诗歌无懈可击地骗过了诗词专家的双眼，打败了国内诗歌高手的时候，人们发现智能写作并非不能涉猎情感类、个性化主题。而最近关于晋江文学网站发现有作者使用自动写稿软件发表文学作品的作弊事件也证明了智能写作进行文学创作几乎可以以假乱真。可见智能写作的发展完全可以突破人类对它的刻板化印象——这又恰恰体现了智能写作的另外一个重要特征：强大的深度学习能力。

人工智能的数据处理能力和深度学习能力在“阿尔法狗”的运行原理中可窥一斑。2017年5月，在中国乌镇围棋峰会上，由谷歌（Google）旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发的人工智能“阿尔法狗”（AlphaGo）与排名世界第一的围棋冠军柯洁对战，以3∶0的总比分获胜。阿尔法狗的工作原理主要就是“数据统计+深度学习”。第一代“阿尔法狗”的学习方法是通过数据统计的方法在结合了数百万人类围棋专家的棋谱基础上，加之强化学习和监督学习而来。而“阿尔法狗”的升级版AlphaGoZero的学习方法则摒弃了人类数据，它从一开始就没有接触过人类棋谱，研发团队只是让它自由随意地在棋盘上下棋，然后进行自我博弈。无论是在短时间掌握所有大数据，还是发挥计算机本身超级计算的特长，人类的大脑都无法在这些方面与人工智能相匹敌。

智能写作的数据处理能力和深度学习能力还融合在以NLP （Natural Language Processing，自然语言处理）为代表的系统算法上，更发挥了智能写作与其他人工智能在语言沟通领域的优势。这可以成为智能写作的第三个特征：强大的智能语言处理能力。NLP，它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法，是计算机科学、人工智能、语言学和人类（自然）语言之间相互作用的领域。NLP的发展经历了从理性主义到经验主义的过渡，越来越多地通过机器学习来获取知识，越来越重视统计方法，出现了强烈的“词汇主义”倾向。随着NLP及其他智能语言处理技术的逐渐升级与进步，智能写作以及其他形式的人机沟通将越来越趋向于完美，更接近

于人类思维。

智能写作种类及发展前景分析

从目前的发展来看，智能写作产品种类从记者到诗人再到小说家，虽然都是同样以文字处理为主业，然则它们被社会认可的程度却大为不同。智能写作种类可以分为：已经合法执业的智能记者；尚不能合法写作的智能文学作者；尚有发展空间的其他形式智能文字处理体系，如智能公文处理体系、网站智能客服等。

智能记者与智能文学作者虽然都以码字为生，但它们的境遇却截然相反。智能记者的写作可以代替人工新闻写作中程式化及数据整合的部分为其最大的优势。和文学写作不同的是，智能新闻写作一开始就并无多少争议地合法化了。而智能文学写作面临的问题就复杂得多。

首先，二者在时效性上的不同以及归属的不同，决定了如版权、剽窃等一系列后续问题的不同。智能记者一般是由新闻单位使用，是纳入在一个组织管理系统中，用于为某新闻组织通过合法方式撰写新闻稿件。而新闻稿件的时效性要求很高，新闻稿件必须第一时间刊发才有新闻价值，也正因为新闻稿件的时效性，其失去新闻吸引力并不断被新的新闻更替的速度也很快。另外，因为目前各大新闻机构还未大批量地使用人工智能进行新闻写作，针对同一新闻事件进行写作的雷同率也不高，出现知识产权争议问题的几率尚低。

文学写作的私人化特点就比较强调没有组织的管理，也没有时效性的限制。人工智能通过学习人类的文学创作进行新的创作时，会使用到人类作品中的创意、构思，甚或一个句子、一个词，乃至是原创中的姓名等信息。这种情况和新闻写作中大量地使用事件信息中的数据是不同的。如果大量地学习或模仿他人的创意并将其构思在一个文学创作中则会受到剽窃的质疑。

其次，二者写作目的的不同，决定了智能写作在两个领域中的价值不同。新闻写作的目的是第一时间传播信息。智能新闻写作可以非常快速地整合数据信息，且在数据处理的正确率上占有绝对优势，这个优势对于新闻业来说是极具吸引力的。而文学创作的目的则主要是为了满足人们情感的需要。单纯辞藻的堆砌或许并没有“那年那时那地”更能勾起人类的情感记忆。除非是为了某种特定的利益，否则写出自己对世界独特的认知和情感才是作家的创作目的。机器进行文学创作，目前除了哗众取宠地引起惊叹（如写诗机器人“九歌”），就是帮助他人渔利（如充斥于网络的自动写作软件）。

除了高大上的智能记者、智能诗人，其实智能写作早已在民间网络经济发展中悄然开始。出于实际需要的网站智能客服目前仍主要以文本服务为主，同时兼容语音服务以及超链接服务的发展。网站语音客服也仍然以文本为基础。这种文本的创作虽然仍处于固定预设的初级文本创作阶段，但已经萌发智能化查询和智能解答的创作。这种创作操作简单，不像智能记者和智能诗人或是智能棋手那样因为技术尖端而显得高深莫测，其开发成本也相对较低而能得到行业普及。由于实际经济发展的需求，以低廉成本代替繁忙的人工网站客服将使其前景可观。

智能公文写作如果建立在现有的电子公文管理体系基础之上，也是有其极为明朗的发展前景的。公文写作的程式化特点，使其具有非常大的智能化操作空间。电子公文业已发展为成熟体系，并已被使用在各行各业的实际公文管理体系。但电子公文只是使用了电子介质用于公文保存和传递，只有将自动写作系统纳入公文写作才能被视作智能公文写作或智能公文管理。目前的电子公文生成系统只是参与了公文写作的格式部分，尚未代替人脑对公文内容的撰制。但其有望升级为由人工智能参与到文本内容写作以及格式，甚至还包括外围的公文保存、传递及查阅等一系列完整体系中去。

智能公文写作在未来将会有更大的、畅通无阻的发展空间。而曾经以文字处理为主的网站智能客服在未来则有望摆脱智能写作的单一局限，而发展为全方位的人机沟通智能小秘书。

在版权、抄袭等敏感问题得到解决之前，智能写作应该首先活跃于那些程式化的、枯燥的、会消耗大量人工精力的写作领域。准确、快速的智能写作将成为帮助人类从枯燥无趣却又耗时费力的写作中解脱出来的好助手。优秀创意的诞生仍将依赖人脑，并非机器就不可能产生创意，只因创意的鉴定最终还是依赖人类的标准和人脑的选择。机器可以从浩瀚的文字中组合出有趣的创意，但能否被肯定并使用仍然由人脑来决定。说回版权问题，如果有朝一日人工智能的创作出于效益的考虑大部分代替了人类的创作，而与人类的欣赏并无违和，则版权就不再有存在的意义。如若取消版权，则机器替代人类进行创作的动力又将何在？文学和艺术的创作需要满足双重的兴趣需求，一个在读者那里，一个在作者那里。作为读者，人类会去欣赏来自机器的创作。但作为作者，人类不会由于机器可以创作就不再产生创作的欲望。

数据红利背景下智能写作的特征与发展

Newspapers in Chinese (Simplified)

Newspapers from China

数据红利背景下智能写­作的特征与发展

Newspapers in Chinese (Simplified)

Newspapers from China

数据红利背景下智能写作的特征与发展