女子与数学 (2)Gender Gap

写这篇文章的动机,并不是因为近来刷屏的姜萍,而是网友的一篇博文《数学,无关性别》。说的是她回国以后得知上初三的表哥的女儿,在数学上遇到了困难,尝试请一位重点中学数学老师帮忙,而这位老师冷淡地表示,女生数学掉链子,无能无力……

同作者一样,我不同意那位老师的态度,但我却这样回:

“数学有点不同于其他学科,事情真的比较复杂、难说。

在完全自由的选择和类似的努力下,性别差异的确明显。我曾经近距离、数年之间(因某种契机)深入了解过我们这个学区最好的约20多个 math kids,包括我自己的两个孩子,我觉得总体上性别差异明显。但这其中确有几个个女生数学也是优秀的,其中两个大学里继续学STEM。所以,对于个体来讲不一定。

数学上最优秀者,两性的比例大约是 1:10,这在任何别的学科都是没有的,不能被歧视、偏见、自信心不足等来充分解释。

…… 我可以写一篇说这个问题,但不愿意趟这涉嫌“歧视”的浑水,被人扔砖头。”

她的回答中有两点,我认为非常中肯:1. 就应付大学以前的数学考试而言,她觉得学习数学“开窍”很重要。2. 她不知道女孩是不是从小就被灌输了性别的差异,因而从思想深处就对数学生出了惰性和怯意。

此外,她鼓励我写有关此问题的文章,不要管别人说什么……

好吧,既然我有一些数据、观察和有关的一些思考,就写出来,言者无罪。

性别差异(gender gap)这种说法早就有,但经常是非常宽泛的,比如平均而言男人比女人力气大,暴力犯罪率高,从政人数多,这些都是gender gap。(BTW,两性的智商平均值没有差异,尽管两性在IQ测验的分项上各有所长。)这里,我们将“性别差异”范围仅限于数学的能力或特长。

2009年,总部设在巴黎的国际组织“经济合作与发展组织”(简称经合组织; Organisation for Economic Cooperation and Development,OECD)开始了一项为期3年,每三年重复的“国际学生评价计划”(Programme for International Student Assessment (PISA)),通过测验评价几十个国家的15岁学生的数学和语言能力。本计划的初衷主要是提供一个量化的、显示不同国家初等教育水平的可比较数据,从而帮助各国制定教育政策。

PISA测验的结果,除了反映各国的差距之外,也反映出了显著性的性别差异 — 1. 在大部分国家,女孩的数学分数低于男孩;2. 在所有国家,男孩的阅读水平低于女孩。这是其中一年的全部结果:

另一个反映性别差异的是SAT成绩。下图左侧是40年间的SAT数学成绩的对比。男生的平均成绩始终比女生高30-40分。(但注意y坐标是从450而不是0开始,在视觉上“放大”了差异。)右图是两性在不同分数段出现的频率,同样表明男生在高分段比例高。(在700分以上,男女比约3 :2 )。

然而,统计表明在SAT阅读考试上,两性是没有显著差异的,有的年份女生还略有优势。下图是纽约州的Vassar College跨越10年,对其入校新生SAT的统计结果。尽管这所学校比较好,SAT的平均分比美国平均值要高很多,但趋势是一样的,即SAT阅读两性没有显著差异,但数学成绩男性平均高15-25分。SAT两个项目的结果表明,不能把女生数学分数稍低归结为教育机会不均等。

现在我们已经知道有关现象了。为了更全面的分析,我们做一个简单的数学模型,并希望它与现实中的广泛的观察和测量相吻合。我尽量简单地说,争取解释清楚:

在自然界、人类社会、以及心理学和教育学中,大量测量值表现为正态分布(normal distribution),比如人的身高、寿命、血压、考试成绩、智商等。正态分布有严格的定义,这里不多说。正态曲线呈左右对称的钟型,两头低,中间高。均值附近出现的频率最高,离均值越远,出现频率越低。均值μ和标准差σ是正态分布的两个特别重要的参数。均值反映了分布在x轴的位置,标准差反映了离散的程度。如果σ 的值大,则分布比较发散,曲线比较扁平。

下图左显示了正态分布的特点,如在正负1个标准差之内,出现频率高达68.2%,而大于3个标准差出现的频率只有0.1%。举个例子:根据定义,标准智商测验的均值是100,标准差是15。因此智商在85-115的人占了68.2%。而智商超过145的人只有0.1% , 因为45是3倍的标准差。

上图右是理解gender gap的关键:红色虚线钟形图是整个人群(男女合并)的分布曲线。如果男性比女性有优势,那么男性的曲线将右移,而女性的曲线将左移。这个shift有多大呢,我对前面PISA和SAT的数据进行了分析(不细说了),我的计算结果是gender gap大约是0.3个标准差。也就是说男性的曲线较两性总和的曲线(红色虚线)右移0.15σ,而女性则左移0.15σ。

这样一个模型,它是不是大致准确呢?我们来看4种不同标准/水准下,两性究竟表现出什么样的gender gap:

A、基本水准:定义为-1.5 σ以上。即经过一定的努力,一般的数学课至少可以及格。(注意,A包含B,C和D,但上面的描述,是仅限于刨去B、C、D的情况)

B、优秀水准:定义为+1.5 σ以上。这样的学生数学考试经常能得A,可以选AP数学,SAT数学经一定准备,能考700分以上。他们可能参加数学竞赛,但获得优胜比较难。他们在大学里可以学STEM,但不是拔尖的学生。(B包含C和D,但上面的描述,是仅限于刨去C、D的情况。)

C、英才水准:定义为+3 σ以上。这是数学的精英,他们 AP数学和SAT数学都不费劲就能够获得接近满分的成绩,在低级别的数学竞赛中经常获奖。到大学里,他们也是STEM专业的优等生。

D、天才水准:定义为+6 σ以上。这是数学上的最尖端者,他们是在数学上有重大建树、获得数学大奖(包括菲尔兹奖)级别的天才。

好,现在我们来分别看。在下图中,我们着重看右边那个曲线下的绿色部分(大于z分值的发生概率),我用大字明确写在图的最右边。依照该模型,作为总体,有93.32%的学生数学可以基本合格(比如可以及格)。由于根据有关数据推算的正负0.15 σ的shift,相当于对男性而言,数字变成了-1.65 σ以上,而女性变更成了-1.35 σ,对应为男生95.05%和女生91.15%数学可以基本合格。也就是说,达到数学基本要求的比例为1.04 :1,两性是很接近的,女生与男生达到数学基本要求的人数差不多。

再看看“优秀水准”的情况,这样的个体占整个人群中的6.68%。根据与上面同样的换算方式,男女的比例,实际上是比较1.35 σ以上的频数和1.65 σ以上的频数,这时男女比例比上面一个图增加了,大约是 1.8 :1。这个结果,与SAT数学考700分以上、数学课大多得A、选修数学AP等情况下,男女生的比例是基本吻合的。

【注:有关“C、英才水准”和“D、天才水准”的话题,我们留待下一篇再说。】

向看官致歉,本篇内容比较干,比较boring。而且在没有机理的情况下说数据,可能会被批评为有bias,甚至有“歧视”之嫌。这个问题的确比较复杂,男性比女性在数学上表现略强,可能是社会期待、个人信心以及生物原因综合的结果。当要求较低时,女生几乎与男生一样好,也许是因为努力和训练可以弥补轻微的劣势。看官去看第一张图,整个东亚地区,包括日,韩、新加坡、香港、上海,在那个比较简单的PISA数学测试下,gender gap都是比较小的,我猜想一个原因可能是东亚文化强调用功,而女孩比男孩更自控一些。然而,用功的作用,在需要天赋的一些高难度操作中,作用就有限了。在国际奥林匹克数学竞赛(IMO)选手中,男生比例很高,也许正是因为这个原因。

人做某件事情的动机的强弱,不仅取决于获得成功后的喜悦和回报,而且取决于对成算的判断和为获得成功所需付出的代价。因此,尽管桃子对所有人都是好吃的,但“下山摘桃子”与“上山摘桃子”的劲头是不同的。假如那山有两千多米高,一名登山运动员飕飕就上去了,水蜜桃吃着舒坦!我老唐气喘吁吁,爬了不到五百米就give up了。你们说我没吃到桃子是因为自信心不够强?


我的其它文章

No post found!

Scroll to Top