以学生为中心的最大似然估计教学探索[10]

刘新红,冯媛,吴春霞,游世超

(北京石油化工学院 数理系)

摘要:最大似然估计法是概率统计课程中的重点和难点,内容枯燥,理论抽象。基于大脑认知模型的构建理论,以学生为中心,采用案例教学法,探究式教学模式等将理论与实践相结合,化抽象为具体,激发了学生学习兴趣,提高了学生学习效果,实现了以学生发展为中心的教学目标和人才培养目标。

关键词:以学生为中心;认知模型;最大似然估计法;案例教学

引言

最大似然估计法是数理统计中的必讲内容,也是参数点估计中的一个重点和难点。在多数版本的教材中,最大似然估计法的讲解均以例题为主,并进行抽象的理论分析和复杂的公式推导。同时,最大似然估计法的教学过程中普遍存在以教师为中心、以教材为中心、以教室为中心的传播模式,这使得学生们的学习兴趣和学习主动性都较低,从而学习效果较差。因此,探究最大似然估计法的讲授方法,有效提高教学效果,具有较强的研究价值。有许多学者在最大似然估计的教改方面作出了一定的探索,本文将案例教学法与以学生为中心(以学生为中心,即是以学生的发展为中心、以学生的学习效果为中心、以学生的学习为中心)的教学理念相融合,在大脑认知模型构建的指导下,精心设计教学过程,展现了学生的学习过程、体现了学生的学习效果、达到了学生的发展目标。从低层次的理解最大似然估计法的思想,掌握最大似然估计法,向应用最大似然估计法解决实际问题、创造建立科学的抽象思维能力、理性思维能力及统计推断思维过渡。

1 引入最大似然估计法的思想

针对最大似然估计法教学过程中存在的问题,采用案例教学法,精心设计,提高教学效果。

(1)通过案例引入最大似然估计法的思想

案例1(课前头脑风暴): 近几年,空气质量问题得到了全社会的关注。由于地理条件因素,北京市各个部分空气质量不一,北部空气质量明显好于南部。2016年11月28日22时北京市空气质量监测报告(北京市环境保护中心实时发布)显示6个监测站点的首要污染物PM2.5指数,两小时后获得PM2.5指数76,指数76看起来最像是哪个监测点的PM2.5值?一次检测就能下结论?如果不能,多少次检测就能下定结论?

表1 北京空气质量实时状态表  

分析:启发学生思考这个现象背后的实质。大数定律表明频率向概率靠近。PM2.5指数76对应的各检测站点的概率是多少呢?通过观察历史上(包括22时)发生的事实(频率)获得。人们一般认为未来一定沿着之前发生的“有利”事实前进。有利,即最可能,可能性最大。得到PM2.5指数76对应的检测站点最可能是怀柔这个结论,怀柔就是“看起来最像”、最可能的估计。

如何得到分布中参数的最大似然估计呢?

案例2:经典故事《狼来了》。放羊娃两次大喊“狼来了”,两次都说谎,戏耍了当地村民,当第三次狼真的来了,他再大喊:“狼来了!”人们没有去救他和他的羊。为什么第三次人们不去救放羊娃和他的羊?放羊娃说谎概率是多少?

分析:重新审视人们对放羊娃的认知过程。人们完全不了解放羊娃时,放羊娃每次大喊狼来了,可能说谎可能诚实,放羊娃两次大喊狼来了,共有四个可能结果:(说谎,说谎)、(诚实,诚实)、(说谎,诚实)、(诚实,说谎)。最后人们对这个放羊娃有了一定的了解,(说谎,说谎)这个结果发生了,其他的三个可能结果都没有发生,那么这个结果发生的可能性应该最大,否则不会在一次观察时它发生。提出问题:放羊娃说谎概率是多大时,两次都说谎这个结果发生的可能性达到最大?

(2)最大似然估计法的思想

在一般的随机问题中,一组样本有各种可能结果,对样本进行一次观察,样本的一个可能结果发生了。衡量这个结果发生可能性的指标——参数,它应选取什么数值,使得前面的观察结果出现的可能性最大?使得前面观察结果出现的可能性达到最大时,参数的取值就是参数的看起来最像,最可能估计,即最大似然估计。这就是最大似然估计的基本思想。

下面将这个基本思想数学化。首先从总体X中抽取一组简单随机样本X1X2,…,Xn。对样本进行一次观察,得到X1=x1X2=x2,…,Xn=xn作为观察结果是,观察结果发生的概率是PX1=x1X2=x2,…,Xn=xnθ),是积事件的概率,θ是分布中的参数。由于样本之间相互独立,积事件的概率等于各自的概率乘积,利用数学连乘符号,记

此函数称为样本的似然函数(Likelihood Function),这是衡量观察结果发生可能性大小的函数。使样本的似然函数Lx1x2,…,xnθ)达到最大时,参数θ的取值称为参数θ的最大似然估计(Maximum Likelihood Estimate,MLE)或称极大似然估计。

最大似然估计法的思想是人类对认知的重塑,是人类认知水平的再一次提高。

2 最大似然估计法的应用

案例3:改编故事《狼来了》。放羊娃n次大喊狼来了,有时说谎,有时诚实,当他第n+1次再大喊狼来了时,人们会来救放羊娃和他的羊吗?放羊娃说谎概率的最大似然估计是多少?

分析:从三个方面指出解决思路,第一,放羊娃每次大喊狼来了时是否会说谎,用X表示,其分布律为

PX=x)=px(1-p1-x x=0,1  

说谎概率p是分布中的参数,这是总体分布的信息。x=1表示放羊娃说谎,x=0表示放羊娃诚实。第二,放羊娃n次大喊狼来了,从总体中产生n个样本X1X2,…,Xn,对这组样本进行观察,得到样本值x1x2,…,xn样本与总体X有相同的分布律为PXi=xi)=(1-pxi=0,1,i=1,2,…,n,这样获得样本信息。第三,最大似然估计是使得似然函数达到最大,而似然函数是样本分布律的连乘积,即

使似然函数Lp)达到最大时p的取值,也就是数学中的求最值问题。似然函数是p的幂函数乘积,求导烦琐。如果能够转换成两项之和,求导过程将简化。对似然函数Lp)两边取对数,lnLp)是Lp)的单调变换,所以它们在相同的地方取得最值。对Lp)两边取对数,得到对数似然函数

求导并令导数为零,即

得到唯一的驻点。唯一的驻点也就是使似然函数达到最大时,参数p的取值xip的最大似然估计值。

这是一个一般的(0-1)分布中参数的最大似然估计,下面考虑更具体的应用。

案例4:续编故事《狼来了》。三种类型的放羊娃,两次大喊狼来了。第一种类型的放羊娃两次都说谎,第二种类型的放羊娃两次都诚实,第三种类型的放羊娃第一次说谎第二次诚实。面对这样的说谎概率估计值,人们第三次会不会救他们?表2中的问号是对学生的提问,前面的问题是参数的最大似然估计是多少,后面的问题是面对最大似然估计值,人们会采取什么行动?

表2 三种类型放羊娃的结局  

分析:人们很可能不会救第一种类型的放羊娃,很可能会救第二种类型的放羊娃,而对第三种类型的放羊娃的认知是模糊不清的,需要进一步取样,获得更详细的信息,再判断。这些分析与人们的认知是完全相符的,从而也可以看出估计可以指导我们的生活,给我们的工作提供建议决策的依据,这部分应用体现了以“学生的发展”为中心的目标。

3 问题的探究与拓展

上述问题是否具有一般性呢?可以引导学生思考:①若X是其他分布类型的离散型随机变量,分布中的参数如何求最大似然估计?②若X是连续型随机变量,分布中的参数如何求最大似然估计?③若分布中有多个参数,如何求得每个参数的最大似然估计?④能否总结最大似然估计法实现的步骤。通过这些问题,启发学生思考,巩固所学知识,并为后续内容的讲解埋下伏笔。

最大似然估计在实际生活中应用广泛:比如,医生通过观察病人的症状,从最可能的患病病因着手进行诊断。公安刑侦人员从最有可能的犯罪嫌疑人出发侦破命案。有经验的技术人员从最有可能出问题的环节出发排查机器故障等。

最大似然估计法的教学设计见图1。具体是:首先,通过头脑风暴——北京空气质量实际问题,引导学生思考最可能的估计。随后采用经典故事《狼来了》,提出具体问题说谎概率的估计,接着抽象到一般随机问题中参数的估计,提出最大似然估计法的基本思想,并将它转化为数学思想。遵循循序渐进的认知规律,引入最大似然估计法的思想。然后利用其数学思想解决了改编故事《狼来了》中参数的估计,最后应用到续编故事《狼来了》,完成说谎概率的参数估计,整个过程中体现了从样本信息推断总体信息的统计推断思维、抽象思维等,同时得到了最大似然估计法计算的基本步骤,描述了现实生活中最大似然估计的应用,结束之前提出课后的思考题目。与大脑的认知过程(图2)完全符合,通过案例教学法,创建了学习情境,用启发式、问题引导式、探究式等教学帮助学生建立“最大似然估计”的认知模型。

图1 教学设计图

图2 大脑的认知过程示意

4 结论

为实现本次课程以“学生的发展”为中心的教学目标,采用案例教学法,激发学生学习兴趣,提高了学生运用所学知识解决实际问题的能力,体现了以“学生的学习效果”为中心的教学过程。通过问题指引、探究式等教学模式,引导学生课前预习课后复习,课上积极思考和回答问题,注重发挥学生学习的主体作用,有效提高学生学习效率,展现了以“学生学习”为中心的理念。以学生为中心,通过构建学生如何学习、学生的学习效果是什么、学生在本部分学习的终极发展目标是什么展开教学工作。此教学方案使学生从简单掌握方法逐步提高到对原有知识的重新认知,达到认知结构的重塑和提升,充分体现了以“学生为中心”的教学理念。

参考文献

[1] 盛骤,谢式千,潘承毅.概率论与数理统计[M].第4版.简明本.北京:高等教育出版社,2009.

[2] 农吉夫.概率统计课程案例教学法的探讨[J].广西民族大学学报:自然科学版,2013,19(3).

[3] 李国安,黄林涛,李建峰.最大似然估计法的探究式教学[J].大学数学,2013,29(3).

[4] 李琼琳.最大似然估计法教学新探[J].信息系统工程,2013(2).

[5] 李明泉.最大似然估计法的教学实例[J].高等函授学报:自然科学版,2013,26(2).

[6] 刘倩.极大似然估计方法的直观教学设计[J].高师理科学刊,2015(6).

[7] 赵炬明,高筱卉.关于实施“以学生为中心”的本科教学改革的思考[J].中国高教研究,2017(8).

[8] 赵炬明.打开黑箱:学习与发展的科学基础(下)[J].高等工程教育研究,2017(4).