语料库在外国文学研究中的应用

作者:施秀川 刊名:剑南文学(经典教苑) 上传者:黄雪花

【摘要】随着近年来国内外不少文学者都将语料库研究的方法用于文学的研究领域,人们最初编撰语料库的作用也在悄然发生着变化。人们最初建设大型语料库的最初目的主要的目的在于词典编撰和语法的研究。一部文学作品的文体风格通常是一个作者在文字交流中形成的具有个人独特的魅力,文体风格的研究也就源于作品的文本,也就是语言的使用。语料库是对大量文学作品进行文学赏析和文学评论的有利资源,并利用语料库检索软件对文学语篇进行相应分析,所以,语料库可以把隐含的结构显现出来,并激发出人的想象力,从而反映出检验文本对读者的感染力。本文通过对语料库的相关阐述,分析了语料库在文学研究中所起到的重要的作用。

全文阅读

语料库在语言研究中的应用是在20世纪60年代后,两者的有效结合导致了语料库文体学的发展。随着近年来语料库语言学的不断发展,文学中的研究逐渐的采用语料库工具来进行各类文本文体特征的描写和定型分析。利用语料库索引技术对文学作品进行多维分析,是学者们文学作品作为最佳的分析对象,同时也为读者鉴赏文学作品提供了一个新的途径和方法。1语料库1.1语料库概论语料库是指经科学取样和加工的大规模电子文本库。借助计算机分析工具,研究者可开展相关的语言理论及应用研究。语料库是语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。现代对于语料库又有了新的定义,即是基于大规模真实文本的语料库,是对语言文字的使用进行动态追踪的语料库,是对语言的发展变化进行监测的语料库,是"活"的语料库。不论哪个定义,一般都包含有以下特点:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源。1.2语料库的分类及应用语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。语料库一般分为四种类型,即:异质的:没有特定的语料收集原则,广泛收集并原样存储各种语料;同质的:只收集同一类内容的语料;系统的:根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;专用的:只收集用于某一特定用途的语料。除此之外,语料库按照预料的语种分可以分为单语的、双语的和多语的。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。对于双语或多语的语料库来说,大致可以分为三类:一是研究双语语料的对齐技术,国内外学者就此提出多种策略和方法,现在已经出现了许多对齐双语或多语语料的程序或工具;二是研究双语语料的各种应用,如在基于统计的机器翻译技术、基于实例的机器翻译技术,双语词典编纂技术中,双语语料库都发挥着十分重要的作用;三是双语语料库的设计、采集、编码和管理问题。1.3语料库规范问题语料库的规范问题主要是对语料加工而言的。汉语语料库首先遇到的规范问题是词语切分。针对汉语语素、词和词组界限不够清晰的问题,还特别提出了“分词单位”的概念。把“分词单位”定义成“汉语信息处理使用的具有确定的语义或语法功能的基本单位”,并且用“结合紧密、使用稳定”的原则作为判断分词单位的标准。这样做避免关于如何界定词的争论。2语料库在文学研究中的现状及对文学研究带来的影响语料库的方法应用于特殊的文学研究在国外已经具有很大的规模。学者们运用语料库和计算机技术作为基础的多维分析法进行了文学研究的语言特征调查。在我国20世纪70年代末,我国逐步建立了一批大规模的应用于汉语计量分析和研究的语料库,例如北京语言文化大学建立的汉语词频统计语料库台湾中央研究院平衡语料库国家语委现代汉语语料库等。到了20世纪90年代,语料库得到了迅速的发展,超大规模语料库的创建和加工,使语料库研究方法得到了广泛的应用,将语料库广泛应用于和文学相关的各个领域逐渐的成为了现在语料库研究的发展趋势。语料库已经成为文学研究的一个重要的手段,随着语料库的实证研究的不断增加,语料库成为了文学研究的热点之一。语料库

参考文献

引证文献

问答

我要提问