首页 理论教育自然语言处理助力网络动漫语言服务

自然语言处理助力网络动漫语言服务

【摘要】:网络动漫提供语言服务的目的在于促进外语学习中听说读写的结合,使观众和玩家(学习者)在赏析动漫和进行游戏活动的过程中能更有效地学习外语。从经济实用性考虑,重点和难句抽取可以在纯文本格式文件中参考传统的文本难度算法基础上进行,避开费时费力的语篇预处理和机器翻译准确性的问题。在传统的文本难度计算中,词汇难度、词频和词长计算都可以在纯文本格式文件中完成。

网络动漫提供语言服务的目的在于促进外语学习中听说读写的结合,使观众和玩家(学习者)在赏析动漫和进行游戏活动的过程中能更有效地学习外语。动漫和游戏出版的最大特色是以图为主,语言部分以会话形式体现,所包含的语言信息量相对较少,不同于文学书籍等书面语言。为方便使用,可对其提供如下三种形式的语言服务,即原始剧本文档、基于词频分级的词汇表和难句表。

1.原始剧本文档

原始剧本文档指动画和游戏的整体剧本文档,如果动画或游戏由很多集构成,文档会比较长。为方便读者查阅,提供的文档格式应该能根据集号、人物名称等进行随机查询。

2.基于词频分级的词汇表

一种成熟的语言一般词汇量很大,但在人们的日常生活会话和书籍中,常用词占了绝大部分。动漫、游戏中的语言对白涉及的词汇不是太多,但让学习者对其达到熟练的听说读写并不容易,很多时候能读懂,但听不懂或不能正确书写;有时能听懂单词句子的语言形式听得很清楚,但不理解其内容,这是由于缺乏背景知识、缺乏共有的图式或语境信息[7]。为了真正能通过观看动画或参与游戏交互实现听说读写全方位的学习,一方面需要通过语言对白了解文化背景和融入其对应的语境,同时有必要把剧本中语言对白的词汇按词频难度抽取出来,形成带有发音朗读和源语言解释的词汇表。学习者如果在对自己不熟悉的词汇进行预习之后再观看动漫或进入游戏活动,不仅利于外语学习,也可提高娱乐质量,再有意识复习会改进人类短时记忆带来的遗忘。(www.chuimin.cn)

3.重点和难句表

网络动漫和游戏中的对话一般是口语,不属于书面语言,因此长难句少。难句一般都比较长,但长句不一定是难句,对于含有成语和俗语的句子,有时虽然短,但却难以理解。如果在动漫和游戏剧本文档编辑完成后自动抽取出剧本中重点和不容易理解的句子,对这些句子给出翻译、难点解释和目标语发音的音频,形成能按集序号进行筛选显示的重点和难句表文件,能帮助学习者更好理解剧本内容和模仿发音。

经济实用性考虑,重点和难句抽取可以在纯文本格式文件中参考传统的文本难度算法基础上进行,避开费时费力的语篇预处理和机器翻译准确性的问题。在传统的文本难度计算中,词汇难度、词频和词长计算都可以在纯文本格式文件中完成。由云平台提供参考传统的确定文本难度算法开发难句抽取软件工具比较容易,虽然不能达到完全的抽取率,但大部分所需要的句子,如含有成语和俗语因素的句子,都可提取出来。

对于在网络动漫和游戏中的某些经典或重要的句子,如果条件允许,也可以由专业领域内的语言专家在产品制作过程中或正式发布进入市场之前人工标记,然后由出版发行公司通过云计算平台上的抽取软件实现自动抽取。