国际传播语料库建设初探
随着我国国际话语体系建设的不断深入,国际传播事业需要不断优化传播布局、拓展传播渠道、完善机制平台并深化融合发展,从而更好地对外传播中国发展成就并积极影响对象国涉华舆论生态。为更好贯彻落实国家相关文件以及习近平总书记在党的十九大报告中提出的要高度重视传播手段建设和创新,提高新闻舆论传播力、引导力、影响力和公信力,党的国际传播事业要抓住时机、把握节奏、讲究策略,体现时度效要求等重要讲话精神,外宣媒体需进一步强化信息化服务,讲好中国故事,对外展现真实、、立体 全面的中国形象,综合提高国家文化软实力。
一、我国语料库建设背景及调研情况
在人工智能促进语言服务发展过程中,作为覆盖范围及应用领域日益广泛的语料库在提高翻译教学质量、培养优秀译员及促进计算机辅助翻译中发挥着日益重要的作用。双语和多语语料库按照语料的组织形式,还可以分为平行()对齐 语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。,目前 我国已经累积了大量各种类型的语料库,:如 葡萄牙语种树库、面向文本分类研究的中英文新闻分类语料库、路透社文本分类训练语料库、中文文本分类语料库、大开放字幕库Open Subtitles的多语言平行语料数据( Open Subtitles Corpus)、《圣经》双语语料库( "Bible" bilingual corpus)、Short messages service(SMS) corpus(短消息服务( SMS)语料)。等
语料库有三点特征,一是语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库;二是语料库是承载语言知识的基础资源,但并不等于语言知识;三是真实语料需要经过加工(分析 和处理),才能成为有用的资源。
目前国际和国内已有大量已建成的语料库,英美国家语料库建设走在世界前列,如BNC英国国家语料库、美国当代英语语料库。我国外语语料库建设多集中于外语口译、教学等领域,语种以英语居多,中国学习者英语语料库及中国英语学习者口语语料库等,实施单位多为高校科研机构等,但针对国际传播的专项人工智能语料库建设仍为空白领域。
人工智能翻译虽发展迅速,但因数字语料库尤其是国际传播相应的语料库建设相对滞后,,目前 语料库使用者多为外语专业、国际新闻专业学生,或只能在内网中使用导致范围受限,或缺乏持久建设已经无法正常使用。国际传播领域应用人工智能翻译存在大量错译现象,传统人工翻译无法紧跟中译外工作量的爆发式增长,,为此 人工智能翻译建设已经迫在眉睫,国际传播语料库建设是解决关键基础性建设障碍的重中之重。要提升人工智能翻译特别是中译外的准确性,就必须尽快启动大型中外对译语料库的建设,为国际传播与走出去提供权威可靠的服务。
二、加强国际传播专业语料库建设的意义
习近平总书记在十九大报告中指出,要高度重视传播手段建设和创新,提高新闻舆论传播力、引导力、影响力、公信力。加强中外人文交流,以我为主、兼收并蓄。推进国际传播能力建设,讲好中国故事,展现真实、、立体 全面的中国,提高国家文化软实力。我国经济和文化的走出去,尤其是“一带一路”等倡议的实施,导致中译外工作量大幅增加,目前中译外人才十分紧缺。
经调研,从2013年起我国整体翻译业务中中译外业务量比例开始显著高于外译中业务量,同年党中央提出的“一带一路”,倡议 极大地拓展了向国际社会展示自己和