基于语料库的英语语言学中外硕士论文词串比较研究

作者:郑艳; 刊名:中国报业 上传者:孙日华

【摘要】本研究在定性和定量语料库分析的基础上,探讨了英语语言学中外硕士论文中四词词串的结构特点及功能特点。结果表明,结构上,两者差异不显著,使用的四词词串大部分是介词短语类词串和名词短语类词串;功能上,两者有显著差异,篇章组织类词串与指示性词串在两个语料库中占有很大比例,而每个主要类别和其亚分类词串的比例不同。

全文阅读

42 中国报业 2019.02(下) 基于语料库的英语语言学中外硕士论文词串比较研究 [摘要]本研究在定性和定量语料库分析的基础上,探讨了英语语言学中外硕士论文中四词词串的结构特点及功能特点。结果表明,结构上,两者差异不显著,使用的四词词串大部分是介词短语类词串和名词短语类词串;功能上,两者有显著差异,篇章组织类词串与指示性词串在两个语料库中占有很大比例,而每个主要类别和其亚分类词串的比例不同。 [关键词]硕士论文 四词词串 对比分析 语料库方法 [中图分类号] G64 [文献标识码] A 郑 艳 词串是由三个或三个以上词语构成的复现序列。随着语 料库语言学的兴起,词串引起了学者们的广泛关注, 尤其在学术写作方面。本研究将对中国英语语言学研究生和本族语研究生硕士论文中的四词词串做对比分析,探究他们在四词词串使用上的不同点和相同点,以期对中国研究生学习英语四词词串表达方式、完成英语论文写作有所帮助,也希望能对 EAP 教学具有一定的参考价值。 研究方法 1. 语料库选取 本研究建立了两个语料库,都属于同一学科。为了保证研究结果的正确性和有效性,两个语料库大小接近,均在百万字以上,截止频率每百万词 30 次。在本研究中,100 篇中国研究生的硕士论文收集于知网,本族语研究生的硕士论文收集于 ProQuest 学位论文数据库。Adobe Acrobat Pro 和CAJ Viewer 被用来浏览 PDF 形式的文本和转换成 word 文档。然后从这 200 篇硕士论文中选择合适的论文。 所有论文经过语料处理后,第一个语料库包含80篇中国英语研究生硕士论文,简称为CPC,总字数1404133。另外一个语料库包含72篇本族语研究生硕士论文,简称为NPC, 总字数 1401207。所选论文都完成于 2009 年到 2014 年之间。 2. 分析工具 本研究选用四词词串作为研究目标,根据 Biber 对词串的定义,使用Antconc 提取目标四词词串,首先打开语料库CPC然后选择“N-gram”按钮,将Min.Size设置为4,然后 设置最小频率为 30,接着确认出所有的目标词串,选出超过30 次的四词词串,在 Antconc 的帮助下从中挑选出至少 5 篇不同论文中的四词词串。对NPC的语料库也采取同样的操作。 最终得到 104 个 CPC 词串和 68 个 NPC 词串。 结果与讨论 1. 两个语料库中的四词词串 提取结果显示,在CPC中有104个词串,总频率为6357 次。在 NPC 中有 68 个词串,总频率为 4168 次。这说明两个语料库中都使用了许多四词词串,CPC 中使用的数量和总频率上都多于 NPC 中。尤其在总频率上,CPC 中的四词词串比 NPC 的多 2189 次。卡方检验 P 值为 0.000,小于 0.05,这说明频率上有显著差异,中国研究生在论文写作中更多地依赖四词词串。 2. 两个语料库中四词词串结构上的对比分析 本研究采用 Biber 对词串结构上的分类方式来对 CPC 中104 个词串和 NPC 中 68 个词串进行分类。Biber 对词串在学术写作中的结构分类如下:①名词词组 + of 片段结构;②名词词组 + 后置短语片段;③介词 +of 片段结构;④其他介词短语类片段结构;⑤先行词 it+ 动词短语 / 形容词短语 ;⑥ 被动结果 + 介词短语类片段;⑦系动词 be+ 动词短语 / 形容词短语 ;⑧动词短语 + that 分句片段;⑨ ( 动词 / 形容词 +) to- 从句片段;⑩副词短语片段;⑪ 代词 / 名词短语

参考文献

引证文献

问答

我要提问