基于语料库的学术论文摘要中的多词序列研究

作者:邓林;李娜;于艳英; 刊名:黑龙江生态工程职业学院学报 上传者:丁强

【摘要】以石油类英语学术论文为例,通过自建小型语料库分析学术论文摘要中的多词序列。结合基于频率和搭配的方法提取石油类学术论文摘要中的多词序列,既考虑其高频频次,又考察其语义完整性,对学术英语教学和教材编撰具有现实意义和实用价值。石油类学术论文摘要中的多词序列有6大类:名词类、介词类、动词类、主谓完整类、状语类及前置it类。高频多词序列的使用体现了学术语篇的客观性。

全文阅读

0引言摘要是学术论文的重要组成部分,既可以与正文共同构成完整的学术论文语篇,又可以单独构成独立语篇。摘要可以方便读者从大量的文献中快速查找、检索相关论文所研究的问题及其方法、结果等,开阔学术视野,提高科研效率,是学术交流和信息传播的重要手段。按照英语本族语者的思维习惯和写作风格撰写英文摘要,是二语学习者的学术成果快速获取同行关注的有效手段。学术论文摘要中存在大量的多词序列(又称词块),这些多词序列体现了学术期刊的偏好和摘要本身的文本结构特点。对于希望达到本族语者使用本族语的流利性和准确性的二语学习者来说,熟练使用多词序列是其语言水平和学术能力的重要表现。反复使用这些多词序列是写作成熟的标志,而缺少这些多词序列则是新手的特点(Haswell,1991)。[1]目前,对学术论文词块的研究主要包括本族语者和非本族语者词块对比研究(胡新,2015[2];潘璠,2016[3]等)、基于语类的词块研究(李梦骁,刘永兵,2016[4];李国敬,曹雁,2015[5];Cai,2016[6];Cortes,2013[7]等)以及基于专业学科的词块研究(王芙蓉,王宏俐,2015[8];Cotosetal.,2017[9];Hy-land,2008[10]等),但鲜有研究涉及石油类的学术论文英文摘要中的词块。1多词序列多词序列又称预制语块、词块等,国外对其研究最早可以追溯到20世纪70年代。最初多词序列被称为预制语块(prefabricatedchunks),用来描述重复出现的词汇组合现象。目前,学术界对词块的界定和提取方法还存在一定分歧。以Biber为代表的学者们采用基于频率的方法抽取和研究词块,认为词块是一定语域中连续共现的词串或词丛,频率是界定词块的基础,词块的结构和语义通常并不完整。Biber等人(1999)[11]利用计算机软件程序,基于频率提取口语及书面语中的高频词块,认为词块必须达到每百万词10频次,并且必须至少出现在5个不同文本中。Biber(2004)[12]在提取大学课堂用语和教材中的词块时采用了更为严格的频率标准,要求词块必须达到每百万词40频次。也有学者认为,基于频率提取的高频词块常常因为结构、语义不完整而不具备教学价值,而且采用这种方法会“摧毁直的序列在心理语言层面更为显著,但是基于频率的界定却认定这些词块地位相当。对词块的界定只有结合频率标准、学习者及教学因素才能使提取的词块具有实用价值。Simpson-Vla-che和Ellis认为词块的识别、界定必须基于频率、覆盖范围、互信息值并参考教学者的观点。此外,基于频率的词块提取方法提取的只能是连续出现的词汇序列,而忽略非连续式出现却有相对完整语义的词块,如“thisisdet(determiner)+NP(Nounphrase)”,而这样的短语搭配在学术语篇中大量存在。因此词块的界定还要考虑类连接和词语搭配。本研究认为词块的界定和提取应基于频率,并考虑其类连接和词语搭配。既要保证提取的词块出现频率高,又要确保其教学价值。本文采用多词序列(Multi-wordsequences)这个术语,因为多词序列所指更全面,不仅包括词汇完全填充的结构(filledsequences),也包括词汇部分填充的抽象结构(partially-filledsequences),如“NPclaimthat(det+n+VP)”。而且多词序列这个术语语义中立,为当代语言学的学者们广泛接受。Wray(2002)认为,词块是“连续或者不连续的话语片段,作为整体储存在大脑中;出现频率高,不受语法限制”。[14]以此为基础,本文

参考文献

引证文献

问答

我要提问