摘要:研究基于自建水利研究性论文摘要特殊小型语料库,通过主题词与关键主题词的统计,描述分析了中外水利论文英文摘要中的主题词汇和主题表达之间的关系,:,研究发现国内外水利论文英文摘要无论在研究主题、研究方式、研究范围、研究内容、研究行为以及研究性质方面都存在差异,究其原因我们认为与经济发展水平有关。
关键词:主题词;关键主题词;语料库;
A Corpus-based Research of Key Words in English Abstracts of China andForeign Water Conservancy Papers
Abstract: Based on the self-built small home and abroad corpora of the abstracts of water oonsenranoy papers, this paper describes the relationship of keywords and topics by using the methods of extracting keywords and key-key words. The findings show that there are great fli士i.erenres in 2 corpus in 士.ive aspects: topicscope, contents, behavior anfl features. It attributes the fliiierenres to the economy development. This research attempts to provide implications to the research ol water oonsenranoy English.
Key words: keyword; key-key word; ooipus; English abstract
英文摘要作为专门用途英语(ESP)的一个分支,水利英语的研究目前国内进行的不多,尤其是采用语料库 语言学的实证研究方法更是不多见。本研究针对 水利论文是因为“论文成为掌握和管理学科社团中 逐渐增长的信息交流的工具” m,而摘要则是一篇论 文的主要内容的精确概括,阐明论文的主题和实质 内容,并且起着决定论文能否被录用和能否吸引读 者的重要作用。主题词是指在一定文本中出现频 率偏高的词,偏高的程度则为该主题词的“关键性” (keyness )m。本文对中外水利论文英文摘要通过数 据统计的方法对其主题词进行描述分析,旨在发现 中外水利论文英文摘要中的主题词词汇和主题表 达之间的关系、词汇的使用特点及其异同,试图从 一种新的视角揭示中外水利论文英文摘要的某些 特征。
一、研究方法及研究步骤
本研究采用基于语料库的主题词分析法,研究步骤如下:
自建语料库。从国内外占主导地位的水利期 刊上采取随机抽样的方法,创建供本研究所用的水利研究性论文摘要特殊小型语料库,分为2个子语 料库,即国内水利论文英文摘要语料库(以下简称 国内摘要)和国外水利论文英文摘要语料库(以下 简称国外摘要),而国外期刊中只选择作者母语为 英语的论文摘要。具体的做法是从中外水利期刊 上各选择50篇论文摘要,分别存为txt.格式,并净化 文本。国外的水利期刊有Water Research,Water Science and Technology, Journal of Hydrology, Ad?vances in Water Resources,国内的水利期刊有《水 利学报》《水科学进展》《水力发电学报》和《水利水 电技术》。其中国内摘要总形符数为8 166,总类 符数为1 866,类形符比为23%;国外摘要总形符 数为10 839,总类符数为2 463,类形符比为23%。
参照语料库。主题词的提取条件是除了有观 察语料库之外,还得有一个较大的参照语料库,至 少是观察语料库的5倍。故米用美国Brown大学的 Brown Corpus作为参照语料库,其包括500个当代 美国英语书面语文体,约1 014 300词。
运用Woixlsmith Tools 4.0进行统计分析。主要 用来对两个观察语料库和一个参照语料库生成词 表和主题词数据库(p<0.0000001)。运用Woixlsmith Tools 4.0生成关键主题词表。打开已经生成的主题词表和关键主题词表进 行观察分析。
二、研究结果及分析
(一)主题词统计结果
国内摘要中,共统计出主题词213个(F>3, P<0.0000001 ),大约占文本总类符数的11.4%。国 外摘要中,共统计出主题词279个,占文本总类符数 的11.3%。表1和表2列举了国内摘要和国外摘要 前十个主题词,均按照X2值从大到小排列,X2值越 大即主题性越大。表中第一列为主题词排列序号, 第二列则为统计出的主题词,第三列和第四列分别 为观察语料库中该主题词的频数和在库中所占的 比率,第五列和第六列为参照语料库中该主题词的 频数和在库中所占的比率,第七列显示为该主题词 的主体性或关键性,第八列为P值(显著水平),在设定范围内1}值越小表示差异显著性水平就越大。
表3和表4为自建的两个语料库国内摘要和国 外摘要的关键主题词表的部分关键主题词(我们列 举了文本分布身10%的关键主题词)。关键主题词 表是通过分别统计国内213个主题词表和国外摘要 279个主题词表而提取获得的,提取过程参见《语料 库应用教程\表中N表示序号,KW表示关键主 题词,Texts为“复现篇数",表示该词在不同的主题 词表中复现数。这些关键主题词是两个观察语料 库中具有超高浮现率的词,基本反映了水利论文英 文摘要的主题,另外这些词也是水利英语这一专门 英语的技术词汇,是水利研究者和水利专业的学生 需要重点掌握的行业术语。 |
核心期刊网(www.hexinqk.com)秉承“诚以为基,信以为本”的宗旨,为广大学者老师提供投稿辅导、写作指导、核心期刊推荐等服务。 核心期刊网专业期刊发表机构,为学术研究工作者解决北大核心、CSSCI核心、统计源核心、EI核心等投稿辅导咨询与写作指导的问题。 投稿辅导咨询电话:18915033935 投稿辅导客服QQ: 投稿辅导投稿邮箱:1003158336@qq.com |