词汇篇之一:为什么你该马上扔掉手里的“巴朗3500”?

之前我们写过如何提高SAT阅读能力的文章,收到了一些小伙伴的吐槽说文章貌似好,然太长不看(T_T)。受到这样的暴击后,我们决定这次(以及以后)把重点要说的内容放在前面:基于新SAT对单词考察要求的变化,巴朗3500等旧SAT词表已不再适用新SAT考试。AADPS推出了新SAT单词表,分为3900词(不含托福单词)和6700词(含托福单词)两个版本,尚未准备的托福的同学务必看后一个版本,而已经考过托福同学可以自行选择看哪个版本。下载链接在文章最后。

考SAT用哪本单词书最好?如果现在对中国SAT考生做一个调查,相信最大比例的答案肯定是巴朗3500。这本书在国内SAT考试圈里俨然已是神一样的存在。在旧SAT考试时期,AADPS的老师也曾是巴朗等书的忠实拥趸。但是,新SAT改革后,对单词要求到底有没有发生变化?那些年我们一起追的巴朗如今还有用吗?今天,AADPS的老师会给大家一个可能意想不到的答案。

新SAT发布官方OG后,AADPS的老师很快了解到新SAT取消了以前专考冷僻词的填空题。在OG中,我们发现College Board(SAT官方出题机构)已明确提出“相比过去那种在短句中考察难词的做法,新SAT将测试您基于文章语境对有用词和短语的理解。这里的有用是指,它们不再是您这辈子只在SAT考试中见一面的冷僻词,而会是您在学校和职业生涯中能遇到的代表性词汇,也将会是您在一生中常用的词汇”(原文请见OG第二章,第13页)。所以,新SAT考试将大幅降低对冷僻词的考试要求,这已是毫无疑问的既定方针。

然而真实的考题是否按既定方针办了呢?AADPS的老师拿到OG后试探性地做了几套官方模拟题,只发现了一个我们认为稍有难度的词汇题(Practice Test 2,Writing部分第36题考察了austere(简朴的)和egregious(极坏的))。所以初步判断,对词汇的要求的确是大幅下降了。

本来到这里我们已经觉得结论基本清楚了,但是AADPS的老师并不满足。为了做更严格的验证,我们选取了目前所有的新SAT阅读和写作部分材料,包括四套OG模拟题、可汗学院的60篇阅读和40篇写作真题、PSAT和SAT的Sample question,甚至还找到了Common Core的11-12年级阅读范文,总词汇量约26万。我们用词频分析软件AntConc从中选取了所有出现的单词,最后得到一张大约包含了1.2万个不重复单词的表(如果经过进一步人工筛选,实际的单词数会小于这个数量,但这里不影响该项分析的结论)。然后,我们逐个去验证巴朗3500中的单词能否在大表里找到,也就是判断这些词是否曾在上述材料中出现过。

结果如何呢?经检验,巴朗3500中的3543个单词,有1964个单词从未出现在上述26万词材料中,比例高达55.4%。我们还捎带对另一本被奉为神书的Direct Hits进行了分析,结果也大体类似。Direct Hits共包括了898个单词,其中563个从未出现在新SAT材料中,比例为62.7%。旁友们,一本单词书里超过一半的单词不会考到是怎样的一种体验??反正AADPS的老师是受到了严重惊吓。

为何会这样?AADPS的老师分析主要是出于以下原因。首先,新SAT改革后,对词汇的考查重点由原先的“识记冷僻词”变成了“理解常用词”,这直接导致了巴朗等书籍收录的一堆难词毫无用武之地。另一方面,巴朗等词表很可能并没有考虑过中国考生的需求。我们知道,美国高中生和中国高中生的平均词汇量(至少在准备SAT考试之前)不在一个水平。根据词汇测试网站testyourvocab.com发布的英语母语者词汇量统计分析,一个参与调查的美国18岁高中生,其平均词汇量在2.2万左右。而一个典型的中国高中生,在认真准备了托福考试后词汇量大概在8000到1万左右,差距很明显。AADPS的老师认为,巴朗等单词书很可能由于默认读者是要应对旧SAT考试的美国高中生,从而把重点放在了美国人眼中的高难冷僻词,反而忽略了许多对中国高中生最有价值并且也尚未掌握的“中难词”。

新SAT不考,高冷词太多,中等难度词偏少……铁一样的事实使我们最终有理由确信,在College Board已经摆明了不再考察冷僻词的新SAT背景下,中国考生如果还要继续投入大量精力背诵巴朗3500等词表,还要把宝贵时间耗在冷僻单词上,相当于是在做无用功。

说到这里有的朋友可能会举手:你们是怎么判断一个单词是否冷僻呢?毕竟新SAT到现在只考了一次,不像旧SAT那样有充足的题库。在样本有限的情况下,某个单词出现一次,另一个单词没出现过,真的能说明前者比后者更常用?

嗯,AADPS的老师也为这个问题考虑了很久,最终我们决定引入“语料库(corpus)”这把牛刀。我们知道,许多语言学者在致力于统计海量文本中的单词规律。而AADPS老师找到了其中的佼佼者,就是全球最大的,部分功能可免费使用的语料库—当代美语语料库(Corpus of Contemporary American English, COCA)。COCA由美国杨百翰大学的语言学教授Mark Davies创建,收录了美国1990-2015年最有代表性的报纸,杂志,小说,学术,口语材料,现已包含了5.2亿单词量。利用COCA,可以从中统计出常用单词表(COCA的用途远不止这些,比如它还是检验英语表达是否地道的极好工具。以后我们会继续深入讨论怎样善用语料库来提高英文写作水平),而这样的单词表应该说是最权威最客观的。

AADPS的老师利用COCA生成了一个按照使用频率的高低排序的前六万常用单词表(COCA 60000),并将巴朗3500和Direct Hits这两个市面上最享盛名的单词表与之比对。具体而言,我们按照每800为一个区间段,统计1-800、801-1600这样每个区间段的单词数量,比如说,我们查到巴朗中的 abominable(可恶的)在COCA中排名24,195位,那么就把落在24000-24800这个区间段的单词总数加1,以此类推。最后,我们画出了这么一张图(纵轴是百分比,横轴是COCA排名,一个单词表的分布重心越靠右,越说明冷僻词多)

巴朗3500和DirectHits的词频分布

从图中可以看到,以COCA 20000做为分水岭,巴朗和Direct Hits确实在分水岭的右边收录了大量的难词。经统计,巴朗3500和Direct Hits分别有约38%和36%的单词不在美国英语中最常用的前20,000单词之列。再一次证明了这些单词表里的冷僻词实在是相当的多。而反观我们上文提到的真题考察的单词egregious和austere,在COCA中的排名只是在第13,223位和第14,194位,妥妥的中等难度词。

所以AADPS的老师强烈建议,参加新SAT考试的同学,应该尽快扔掉手里的巴朗们,重点关注COCA 排名在20000之内的核心单词。从投入-产出比的角度来说,优先掌握这些高频生词是最能立竿见影的,也是最事半功倍的。超出这个区间段外的冷僻词逐渐增加。尽管从总量上说排名超过20000的单词仍然有很多值得学习,但从投入时间比例来说还是要有所取舍。

下面是广告时间。AADPS的老师通过一系列技术手段,依托市面上现有的单词表进行了大幅度的改良。具体解决问题的思路和许多细节我们将在下周公布,但是我们现在先把做好的单词表下载链接放出来。在这里我们预先放一张AADPS单词表和巴朗3500的词频分布对比图。图中大家能非常直观的看到AADPS单词表所代表的蓝线“重心”明显偏左,因为我们的单词表重点关注高价值的、难度适中的SAT考试单词。而且在COCA值超出 20000以后,蓝线显著低于橙线,主要是由于我们的单词表相比巴朗3500显著地降低了难词比例。

AADPS单词表和巴朗3500等词频分布

我们真心相信它更适用于准备新SAT考试的中国同学。

另外需要说明的一点是,为了方便同学根据自己的状况确定复习重点,我们分别选取了约3900个新SAT单词和约2800个托福单词。但是这两类单词唯一的不同点是后者曾经出现在过往较流行的某本托福单词书上而前者没有,而其他的质量评估标准是完全一致的。所以,这里的“托福单词”的准确名字应该是“曾经在某本托福单词书上出现过的高价值SAT词汇”。所以请切勿认为这两类单词是“高低档”的关系,我们这么分类只是为了方便同学根据自身情况分配时间而已。

感谢您不辞辛劳看到了这里。欢迎下载试用我们的单词表,我们已经为单词表配上了简单的释义,并按照词频高低对其进行了排序。下载请点击:

链接
密码:0bck

另外如果您有任何疑问,都请在微信号后台留言,或注册后在网站评论。AADPS的老师将为您解答。

顺便说一下,从今天开始,AADPS在网站和微信公众号开设了《SAT新天地》专栏,将在每周四为您带来关于SAT等标化考试的高质量原创分析。这篇文章就是我们专栏的第一篇文章。今后,AADPS愿意分析从单词语法到阅读写作,从书籍推荐到复习指南,从考题分析到思维训练……一切与SAT考试相关的内容,为大家及时提供最靠谱的信息和建议。

版权申明

本文为AADPS原创,保留著作及出版权利。欢迎非盈利性质的转载,但须保留作者和原始发布地址。

本文的原始发布地址是https://aadps.net/2016/8037.html。我们每年夏季会更新最新美国大学本科申请文书题目和权威院校指南,欢迎把网站加入浏览器收藏夹。

发布者

《词汇篇之一:为什么你该马上扔掉手里的“巴朗3500”?》上有2条评论

发表评论