教育资源为主的文档平台

当前位置: 查字典文档网> 所有文档分类> 高等教育> 文学> 初级汉语综合课教材词汇的频率与复现

初级汉语综合课教材词汇的频率与复现

上传者:孙正军
|
上传时间:2015-04-15
|
次下载

初级汉语综合课教材词汇的频率与复现

王玉响 加州大学戴维斯 刘娅莉 北京大学对外汉语教育学院

DOI:10.16131/http://wendang.chazidian.com44-1669/g4.2013.04.010

2013年第4期

No.4

2013

华文教学与研究

TCSOLStudies

总第52期

SumNo.52

初级汉语综合课教材词汇的频率与复现①

王玉响1,刘娅莉

2

(1.加州大学戴维斯校区语言学系,美国,加利福尼亚,戴维斯95616;

2.加州大学戴维斯校区东亚语言与文化系,美国,加利福尼亚,戴维斯95616)

[关键词]初级汉语综合课;综合课教材;课文词汇;词频;复现[摘

要]本文考察了两部(国内外各一部)初级汉语综合课教材课文词汇的频率与复现,结

果发现:出现次数上,平均词频较高,但教材低频词(出现次数≤2)的数量过多,教材高频词(出现次数≥3)的数量偏少;自然高频词的复现不足,自然中频词和低频词的复现力度相当薄弱;复现间隔上,跨册复现较好,但文本分布较低;词汇出现时的义项和搭配上,两部教材的处理也不太一致。

[中图分类号]H195.3

[文献标识码]A

[文章编号]1674-8174(2013)04-0075-09

0.引言

第二语言习得中,词汇起着至关重要的作用(Nation,1990;Laufer,1991),尤其在初级阶段,词汇是影响语言流利度最重要的因素(陆俭明,2000;Vermeer,2001)。培养初级汉语学习者的学习兴趣,减少其挫败感,并鼓励其后续学习的最有效的切入点便是教师教学和学生学习的媒介———教材。

通过考察国内外近年来涉及教材(尤其是初级教材)词汇的研究,我们发现,教材词汇的选择和编排,最重要的依据是词频和复现(Nation,

出现次数;复现,强调的是重复。

要编写精品教材,要研发国内、国外适用的教材,有必要对现有教材词汇的频率和复现情况进行系统考察(周小兵、刘娅莉,2012)。为此,我们考察了近年来出版的两部初级汉语综合课教材,国内外各一部:

《博雅汉语·初级起步篇》称“《博雅》”)

《中文听说读写》

(LEVEL1PART1、2),

刘月华、姚道中主编,美国Cheng&Tsui

(Ⅰ、Ⅱ),李

(以下简

晓琪主编,北京大学出版社,2005。

Company,2009。(以下简称“《听说》”)

这两部初级教材影响力大,使用范围广,具有可比性。我们依据《现代汉语词典》版)

(中国社会科学院,2005)、

2001;Ellis,2002;赵金铭,1998;苏新春,2006)。词频是指词在被调查语料中出现的频次;词频减1就是词的复现数(国家语言资源监测与研究中心,2009)。在同一语料库下,词频和复

现数是同一个概念的两个方面:词频,强调的是

[收稿日期]2013-03-04

(第5

《现代汉语语

料库词语分词类频率表》对这两部教材的所有

课文统一进行了分词处理,得到课文词汇。为

[作者简介]王玉响(1981-),男,安徽人,美国加州大学戴维斯校区语言学系博士研究生,研究方向为教材研发、课堂教学。刘娅莉(1981-),女,四川人,语言学博士,美国加州大学戴维斯校区东亚语言与文化系访问学者,研究方向为汉语作为二语习得、教材研发。

①本论文在第三届中文教学论坛(CLEF,2012年11月,美国加州)上宣读,并得到与会专家的意见。此

外,周小兵、苏新春、储诚志三位教授以及匿名审稿专家也为本文的撰写提出了宝贵意见,在此一并致谢。文中结果和观点概由笔者负责。

②现代汉语语料库为国家语委平衡语料库的“核心库”,下文简称“语委语料库”。该语料库收词151515个,基本反映了现代汉语的语言面貌(苏新春,2007;肖航,2009)。文中的“自然语料”和“自然词频”就是指该语料库语料及其词频。该词表见于其官方网站http://www.cncorpus.org。

75

王玉响 加州大学戴维斯 刘娅莉 北京大学对外汉语教育学院

华文教学与研究

将分析的重点集中在“语言词”上,我们删除了人名、地名、机构名、时间词等,然后从词频与复现的角度,对课文词汇进行了分析。

2013年第4期

汇习得有重要作用,但对于词汇应出现的最低次数,不同研究者持不同看法。主要观点包括:3次(柳燕梅,2002)、3~5次(江新,

1.理论基础

词汇重复出现,在二语词汇习得中具有非常重要的作用,这可从神经学和心理学两个方面做出阐释。

2005)、5次(Bunker,1988;Horst,1998)、6次(Crothers&Suppes,1967)、7次(Kachroo,1962)、9次(Rott,1999)、10次(Webb,2007)、20次(Waring&Takaki,2003)。虽然

在出现次数上观点不一致,但基本一致的观点是:出现次数越多,词汇越有可能被习得(Bunker,1988;Rott,1999)。

1.1神经学基础

词汇连接着外界事物和我们头脑中的概念,词汇的习得过程正是建立这种连接的过程:外界刺激,经由神经细胞一个接一个地传递,形成通道。不断重复该连接,能够增强通道,使任务简单化。最后,同一刺激能够自动激活一个已经定形的通道。此时,神经元突触结构稳定下来,不再发生改变,该连接得以完全巩固(Criado&Sánchez,2009)。

2.2初级汉语教材课文词汇出现次数的相

关研究

涉及初级汉语教材课文词汇出现次数的实证研究,我们仅发现两例,且观点比较一致。柳燕梅(2002)对零起点学生进行的实证研究显示:习得效果上,词汇出现3次显著优于2次;出现2次显著优于1次。江新(2005)对初级汉语学习者的实证研究显示:在音义习得上,出现3次以上的词显著好于1次和2次的词:3~5次组被试在拼音、意义、音义皆知三项上的正确率分别为91%、88%、78%。但“整词复现率为3次以上时,我们没有发现双字词的成绩随词的复现率增加而持续提高”

(江新,

1.2认知心理学基础

词汇习得的过程也是认知的过程。在该认知过程中,记忆发挥着重要的作用。记忆可分为短时记忆和长时记忆。短期记忆是外界信息的入口,但它容纳信息的能力十分有限,新信息进入后会挤出原有信息。只有通过重复,才能使信息进入长时记忆,避免遗忘(Sánchez&

2005)。

鉴于教材最重要的任务是教授新词,不可能一味地重复已学词汇,我们认为,与大量重复出现相比(如10次、20次),教材中出现3次更可行。因此,本文以出现3次为界,来考察教材的词汇出现次数:词频=1,为零复现;词频=2,为低复现;这两类词,称为“教材低频词”。词频≥3,为高复现,我们称之为“教材高频词”。

Criado,2010)。

1.3词汇重复出现对初级汉语学习者的重

要作用

词汇的重复出现,在二语词汇习得中不可或缺。衡量二语词汇习得最重要的两个标准是词汇的广度和深度。前者指学习者的词汇量;后者指学习者对这些词汇的了解程度(Anderson

&Freebody,1981)。重复出现,既能帮助学

习者增加词汇量,也能帮助他们更好地了解词汇的形式、位置、功能和意义等(Tinkham,

2.3两部教材课文词汇的出现次数2.3.1出现次数的总体情况

两部教材词汇出现次数的总体情况如表1所示:

1993;Nation,2001;Vermeer,2001)。

初级综合课教材,作为学习一门外语的核心入门教材,无疑担负着词汇复现这个重要任务。下面我们从出现次数、复现间隔、出现时的义项及搭配3个方面,考察上述两部教材的课文词汇。

1)出现次数总体较高,平均词频远远高

于3次。

2.词汇的出现次数

2.1研究背景

绝大多数研究者一致认同,出现次数对词

2)对比两部教材的平均词频,《博雅》(6.47)略高于《听说》(6.18),两者相差0.29次。

3)教材“前20高频词”与自然最高频词基本一致。如“的(1①)、了(2)、是(3)、在(4)”等都是自然语料中的最高频词。只有

76

王玉响 加州大学戴维斯 刘娅莉 北京大学对外汉语教育学院

王玉响,刘娅莉:初级汉语综合课教材词汇的频率与复现

表1:课文词汇出现次数的总体情况

教材总课数总词频(次)词种数(个)平均词频(次)

《博雅》

《听说》

55958314826.47

的、我、了、是、一、你、不、有、个、吗、好、去、在、很、就、天、也、看、他、来

2046127466.18

我、你、了、的、是、不、好、一、个、吗、有、很、看、这、去、我们、吃、还、那、要

前20高频词(频次由高到低)

个别词,如“吗(144)、吃(164)、天(221)”,在自然语料中常用度稍低一些,但也在前250位。相对于自然语料库中庞大的词种数(15万),这些词显然也应算作自然语料中的最高频词。

“吗”之所以能够位于教材“前

同。因此,删除高频词时不能“一刀切”,而应根据覆盖率。

经统计,覆盖率达到50%时,所需词数为67个,

《博雅》

《听说》为51个,仅分

别占到两部教材词种数的4.52%和6.84%。这些词的频次非常高,如《博雅》第67词“请”出现24次,

《听说》第51词“她”出

现18次。我们将这50%的词看作教材的绝对高频词。为更清楚地考察一般词汇在教材中的出现情况,我们删除这些绝对高频词后,再次考察了两部教材课文词汇的出现次数,见表2:

表2:删除绝对高频词后课文词汇的出现次数

教材总词频(次)词种数(个)平均词频(次)

《博雅》

《听说》

20高频词”以内,是重要语法点“疑问句”的

教学需要,也与初级教材多用对话体有关;而“吃”、

“天”则是初级阶段重要话题“吃饭”、

“日期”的教学需要。

2.3.2删除绝对高频词后的出现次数

齐夫定律(Zipf,1949)指出,在自然语

料库中,一个词的频率和它的常用度序位成反比。序位为1的词(即频率最高的词)的频率是序位为2的词(即频率次高的词)的频率的

2倍;序位为2的词的频率是序位为4的词的频率的2倍;以此类推。该定律反映出“一小

部分词汇覆盖了绝大部分文本”的语言现象(Milton,2009)。齐夫定律同样适用于汉语,包括不同类型的语料库(Shtrikman,1994;

479114153.39

23076953.32

Xiao,2008)。

这两部教材的课文构成两个小型语料库,词汇频率分布符合齐夫定律。删除这些“覆盖绝大部分文本的一小部分词汇”,即绝对高频词,可以帮助我们更清楚地了解教材词汇的复现情况(Milton,2009)。康艳红、董明(2005)就曾使用过删除教材中前20位高频词的方法。但我们认为,两部教材的总词次、总词种数均不同,故某个固定数量(比如前20)的高频词在总词次和总词种中所占比例也就不

1)删除绝对高频词后,《博雅》与《听

说》的平均词频分别下降到3.39和3.32,依然高于3次;这说明,这两部教材对词汇复现给予了一定程度的重视。

2)再结合表1,与删除前相比,删除

后两部教材的平均词频更为接近,仅相差

0.07次;这说明,一般词汇(即绝对高频词

以外的词汇)的复现力度,两部教材大致相当。

①表示该词在语委语料库中的常用度序位。序位靠前,如:(1),则词频高,常用度高;序位靠后,如:(5000),则词频低,常用度低。下同。

77

王玉响 加州大学戴维斯 刘娅莉 北京大学对外汉语教育学院

华文教学与研究2013年第4期

“自然高频词”、见表3。

表3显示出各自然词频段词汇的出现情况,两部教材呈现出一些类似的特点:

“自然中频词”、

“自然低频

2.3.3各自然词频段词汇在教材中的出现

次数

我们根据张凯(1997)、李清华(1999)、

词”)。这3个词频段词汇在教材中的出现情况

Nation(2001)、Schmitt(2008)等的研究,把自然词频由高到低分为3个词频段(1~2500词、2501~5000词、5001+词;分别简称为

表3:各自然词频段词汇在教材中的出现情况

自然高频词

博雅汉语=1次博雅汉语=2次博雅汉语≥3次中文听说读写=1次中文听说读写=2次中文听说读写≥3次注:

自然中频词自然低频词合计

254/17%133/8.8%421/27.9%114/14.7%71/9.2%257/33.2%

113/7.5%53/3.5%73/4.8%46/5.9%24/3.1%31/4%

261/17.2%96/6.4%78/5.2%97/12.5%54/7%52/6.7%

628/42.4%282/19%572/38.6%257/34.4%149/20%340/45.6%

“/”前的数字为词种数,“/”后的数字为该类词在该教材中所占比例。

1)总体而言,教材总词种复现不足,

“教材低频词”多于“教材高频词”。

《博雅》

中,73个词出现次数≥3,166(113+53)个词出现次数不足3;共收435个自然低频词,其中,78个词出现次数≥3,357(261+96)个词出现次数不足3。

《听说》情况类似。

比如“照顾(2637)、椅子(3954)、旅行(4344)、累(3595)、舒服(3958)”等自然中频词,

“饭馆(11722)、起床(9734)、看

病(10608)、糟糕(12057)”等自然低频词,在两部教材中的出现次数均不足3次。这些词,并非初级阶段的重点词汇,编者让其“低出现”而非“高出现”,让学习者“了解”而非“巩固”,有一定道理。但“低出现”词的数量过于庞大,能被学习者习得的十分有限。

对比两部教材,我们发现:尽管平均词频上,说》

《博雅》略高于《听

《听

(2.3.1和2.3.2),但词频分布上,

1482个总词种中,高复现词仅572个词,高达910(628+282)个词的出现次数不足(仅1次或2次)。《听说》情况类似,746个总词种中,高复现的词仅340个,出现次数不足的词高达406(257+149)个。再结合表1和表2,可看出:尽管教材的平均词

频(包括删除绝对高频词后的平均词频)比较高,但词频的分配并不佳。这就造成大量的词出现次数不足,这种情况显然不利于词汇的习得。

2)自然高频词复现不足。该词频段词汇,《博雅》共收808个。其中,仅421个词出现次数≥3;有高达387(254+133)个词出现次数不足。《听说》共收442个,其中,出现次数≥3的词仅257个,有185

(114+71)个词出现次数不足。比如,提高(213)、活动(237)、计划(279)、国际(590)、清楚(852)、紧张(1158)等自然高频词,在两部教材中的出现次数均不到3次。自然高频词是初级词汇教学的重点(Nation,2001),很显然,其复现力度还有待加强。

说》却优于《博雅》。这表现在:

1)总词种复现的比例,

《听说》《博雅》

《听说》比《博

(42.4%);

雅》合理。具体表现在:零复现词的比例,

(34.4%)低于《博雅》

《听说》

(38.6%)。

高复现词的比例,

(45.6%)高于

3)自然中频词和自然低频词的复现力度相当弱。《博雅》共收239个自然中频词,其78

2)初级阶段最应学习的自然高频词中,高复现词所占比例,《听说》(33.2%)也高于《博雅》(27.9%)。

王玉响 加州大学戴维斯 刘娅莉 北京大学对外汉语教育学院

王玉响,刘娅莉:初级汉语综合课教材词汇的频率与复现

2.3.4相同容量下的对比

平均词频上,词频分布上,

《听说》低于《博雅》;但《听说》却优于《博雅》。为何

合理,我们对《博雅》的课数进行了删减。

经比对,我们发现,词种数(755)与《听说》

《博雅》前33课的(746)最为接近;

会呈现出这种矛盾呢?如果容量相同,表现会一致吗?哪部教材更优呢?为排除由教材容量、规模不同对结论造成的影响,使对比更为

表4:课文数

《博雅》前33/36课课文词汇的出现情况

词汇范围全部词汇

前33课

删除绝对高频词后

全部词汇

前36课

删除绝对高频词后

《博雅》前36课的总词频(4531)与《听说》(4612)最为接近。删减后,课文词汇的词频情况如下:

总词频(次)总词种(个)平均词频

3984198745312252

755707849798

5.282.815.342.82

对比表4与表1、2,可以清楚看到,平均词频上,

《博雅》

(删减容量后)远低于

《博雅》

《听说》。其全部词汇的平均词频,

均词频,《听说》是优于《博雅》的。

(删减容量后)各词频段的

《博

再看《博雅》

词汇分布情况,见表5。

对比表3和表5可见,删减容量后,雅》的词频分布情况并未改变:零复现词、低复现词、高复现词三项中,零复现词(前33课:45.8%;前36课:45.7%)的比例仍然是最高的。

为5.28(前33课)、5.34(前36课),远低于《听说》的6.18(见表1);删除绝对高频词后的平均词频,

《博雅》为2.81(前33课)、

2.82(前36课),低于《听说》的3.32(见表2)。这说明,在教材容量一致的情况下,平

表5:

《博雅汉语》

(删减容量后)各自然词频段词汇在教材中的出现情况

自然高频词

自然中频词

自然低频词

合计

前33课=1次前33课=2次前33课≥3次前36课=1次前36课=2次前36课≥3次注:

150/19.9%73/9.7%212/28.1%162/19.1%84/9.9%236/27.8%

57/7.5%22/2.9%29/3.8%67/7.9%27/3.2%32/3.8%

139/18.4%37/4.9%36/4.8%159/18.7%43/5.1%39/4.6%

346/45.8%132/17.5%277/36.7%388/45.7%154/18.2%307/36.2%

“/”前的数字为词种数,“/”后的数字为该类词在该教材中所占比例。

2.3.5小结

通过对比(包括整部对比和容量一致下的对比),我们可以清楚看到:教材词汇的复现,《听说》显然进行了更精心的设计;也就是说,教材编写时,其词汇的频率与复现是可控的。

中的复现)相比,间隔复现对二语词汇习得更加有效(Dempster,1987;Bahrick等,1993;

Matsuoka&Hirsh,2010)。

3.1词汇的文本分布与跨册复现

文本分布,考察一个词出现的课文数;跨册复现,考察有多少第一册的词汇在第二册得到复现。这两项指标,很大程度上可以说明词汇间隔复现的安排是否合理。我们的考察结果如表6所示:

3.词汇的复现间隔

间隔复现,是指词在不同课文中的复现。据心理学研究,与集中复现(即词在同一课文

79

版权声明:此文档由查字典文档网用户提供,如用于商业用途请与作者联系,查字典文档网保持最终解释权!

下载文档

热门试卷

2016年四川省内江市中考化学试卷
广西钦州市高新区2017届高三11月月考政治试卷
浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
广西钦州市钦州港区2017届高三11月月考政治试卷
广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
广西钦州市高新区2016-2017学年高二11月月考政治试卷
广西钦州市高新区2016-2017学年高一11月月考政治试卷
山东省滨州市三校2017届第一学期阶段测试初三英语试题
四川省成都七中2017届高三一诊模拟考试文科综合试卷
2017届普通高等学校招生全国统一考试模拟试题(附答案)
重庆市永川中学高2017级上期12月月考语文试题
江西宜春三中2017届高三第一学期第二次月考文科综合试题
内蒙古赤峰二中2017届高三上学期第三次月考英语试题
2017年六年级(上)数学期末考试卷
2017人教版小学英语三年级上期末笔试题
江苏省常州西藏民族中学2016-2017学年九年级思想品德第一学期第二次阶段测试试卷
重庆市九龙坡区七校2016-2017学年上期八年级素质测查(二)语文学科试题卷
江苏省无锡市钱桥中学2016年12月八年级语文阶段性测试卷
江苏省无锡市钱桥中学2016-2017学年七年级英语12月阶段检测试卷
山东省邹城市第八中学2016-2017学年八年级12月物理第4章试题(无答案)
【人教版】河北省2015-2016学年度九年级上期末语文试题卷(附答案)
四川省简阳市阳安中学2016年12月高二月考英语试卷
四川省成都龙泉中学高三上学期2016年12月月考试题文科综合能力测试
安徽省滁州中学2016—2017学年度第一学期12月月考​高三英语试卷
山东省武城县第二中学2016.12高一年级上学期第二次月考历史试题(必修一第四、五单元)
福建省四地六校联考2016-2017学年上学期第三次月考高三化学试卷
甘肃省武威第二十三中学2016—2017学年度八年级第一学期12月月考生物试卷

网友关注视频

沪教版牛津小学英语(深圳用) 五年级下册 Unit 12
七年级英语下册 上海牛津版 Unit9
二年级下册数学第一课
8.对剪花样_第一课时(二等奖)(冀美版二年级上册)_T515402
冀教版小学数学二年级下册第二周第2课时《我们的测量》宝丰街小学庞志荣.mp4
苏科版八年级数学下册7.2《统计图的选用》
沪教版牛津小学英语(深圳用) 四年级下册 Unit 7
【获奖】科粤版初三九年级化学下册第七章7.3浓稀的表示
【部编】人教版语文七年级下册《老山界》优质课教学视频+PPT课件+教案,安徽省
沪教版八年级下册数学练习册一次函数复习题B组(P11)
【部编】人教版语文七年级下册《过松源晨炊漆公店(其五)》优质课教学视频+PPT课件+教案,辽宁省
【部编】人教版语文七年级下册《老山界》优质课教学视频+PPT课件+教案,安徽省
冀教版英语三年级下册第二课
【部编】人教版语文七年级下册《老山界》优质课教学视频+PPT课件+教案,安徽省
沪教版八年级下册数学练习册21.3(3)分式方程P17
二年级下册数学第二课
8.练习八_第一课时(特等奖)(苏教版三年级上册)_T142692
外研版英语七年级下册module3 unit2第二课时
冀教版小学英语五年级下册lesson2教学视频(2)
冀教版英语五年级下册第二课课程解读
化学九年级下册全册同步 人教版 第25集 生活中常见的盐(二)
8 随形想象_第一课时(二等奖)(沪教版二年级上册)_T3786594
沪教版牛津小学英语(深圳用) 四年级下册 Unit 3
沪教版牛津小学英语(深圳用) 四年级下册 Unit 4
人教版历史八年级下册第一课《中华人民共和国成立》
3月2日小学二年级数学下册(数一数)
沪教版八年级下次数学练习册21.4(2)无理方程P19
七年级英语下册 上海牛津版 Unit5
《小学数学二年级下册》第二单元测试题讲解
小学英语单词