混合模型的贝叶斯分析与选择

2022-08-07 14:27:22   文档大全网     [ 字体: ] [ 阅读: ]

#文档大全网# 导语】以下是®文档大全网的小编为您整理的《混合模型的贝叶斯分析与选择》,欢迎阅读!
叶斯,混合,模型,选择,分析
混合模型的贝叶斯分析与选择

新疆大学毕业论文(设计)

题目:混合模型的贝叶斯分析与选择指导老师: 吴黎军 学生姓名:蔡敏

所属院系:数学与系统科学学院 专业:数学应用数学 班级:应数11-1

完成日期:2021528 声明

本人蔡敏声明该毕业论文(设计)是本人在吴黎军老师指导下独立完成的,本人拥有自主知识产权,没有抄袭、剽窃他人成果,由此造成的知识产权纠纷由本人负责. 声明人(签名) 年月日

蔡敏在吴黎军老师的指导下,按照任务书的内容,独立完成了该毕业论文(设计,吴黎军老师已经详细审阅该毕业论文(设计 指导教师(签名) 年月日 新疆大学

毕业论文(设计)任务书 班级:应数11-1班姓名:蔡敏


论文(设计)题目:混合模型的贝叶斯分析与选择 专题:统计

要求完成的内容: 1.介绍混合模型的基本概念以及研究合模型 的基本方法.

2.介绍EM算法,以及基于其算法的改进算法 EM算法.

3.利用EM算法对混合正态模型进行参数估计; 利用SEM算法对混合Gamma模型进行参数 估计.

发题日期:2014310日完成日期:2021 528实习实训单位:无地点:无 论文页数:23页;图纸张数:无 指导教师:吴黎军 教研室主任:吴黎军 院长:滕志东 摘要

混合模型可以作为许多工程实际问题的数学模型,具有重要理论以及实际意义。在理论方面的研究主要集中在混合模型参数的估计和混合分量个数的估计。本文主要通过贝叶斯方法以及极大似然方法,在混合分量已知的情况下,对正态混合模型以及Gamma混合模型的参数估计进行了理论推导。


其主要内容为:首先我们简单地介绍了混合模型以及研究合模型的两种主要方法,之后基于EM算法对混合正态模型进行了参数估计的理论推导。我们发现虽然EM算法有算法简单易理解,且易通过编程来实现的优点。但该算法对初值的依赖性较大,且收敛速度慢。因此我们提出了改进之后的SEM算法,即在原来EM算法中加入了随机步来改善EM算法,使其收敛速度快,且不依赖于初始参数值。并利用该算法对两个Gamma混合模型的参数估计进行了理论推导。最后我们采用贝叶斯估计对二元正态混合模型的参数进行了估计,以及对基于MCMC算法的混合正态参数模型的参数估计的过程做了简要的介绍。通过运用不同的方法对混合模型的参数估计进行理论推导,为其在实际中的运用奠定了理论基础。 关键字:混合模型;正态混合模型;Gamma混合模型;EM ABSTRACT

Mixture model can be used as the mathematical model in the engineer fieldsso the study of mixture model is significant,In study of theory,there are two problems.One is parameter estimationthe other is estimation of groups number.This paper mainly through the Bayesian method and maximum likelihood method, In the condition of known in mixed component, estimate the


parameter of Gaussian mixture model and the Gamma mixed model.Main content is:First we simply introduce the hybrid model mixed models, and the two main methods, then based on EM algorithm for Gaussian mixture model parameter estimation theory is derived.We found that although the EM algorithm is easy to understand, and the advantage of easy realized through programming.But the dependence on initial value is bigger, the algorithm and the slow convergence speed.So we proposed that the improved SEM algorithm, which joined the random walk in the original EM algorithm to improve the EM algorithm, the convergence speed, and is not dependent on the initial parameter values.And by using the algorithm of two Gamma mixed in the parameter estimation of the model. Finally we use Bayesian estimation for binary parameters of Gaussian mixture model are estimated, and based on the mixture of MCMC algorithm is the process of the parameter estimation of the model parameters are briefly introduced.By using different methods of hybrid model parameter estimation theory, for its laid a theoretical basis for the application in practice.


Key Words: Mixture model; Gaussian mixture model; Gamma mixture model; EM algorithm. 目录

..................................................................................................................................................

I

ABSTRACT .................................................................................................................................... I V



................................................................................................................................................. V 1 引言 . (1)

1.1 研究背景、意义以及研究方法简介 (1) 1.1.1 研究背景及意义 (1) 1.1.2 研究现状 (2) 2 混合模型 (3)

2.1 混合模型的简要介绍 (3) 2.1.1 感兴趣的问题 (3) 2.1.2 缺损数据的形式 (4) 2.2 主要研究方法介绍 (4)


2.2.1 极大似然方法 (4) 2.2.2 贝叶斯分析法 (5) 3 混合模型的参数估计 (7)

3.1 基于EM算法的混合正态模型的参数估计 (7) 3.

1

.1

EM









................................................................ 7错误!未定义书签。 3. 1. 2参数估计的理论推导 (7)

3.2 基于SEM算法的混合Gamma模型的参数估计 (10) 3.

2.1

SEM









............................................................ 10错误!未定义书签。 3. 2.2 参数估计的理论推导 (11)

3.3 基于MCMC算法的混合正态模型的参数估计 (12) 3.3.1 二阶混合正态模型的贝叶斯估计 (12) 3.3.2 MCMC算法介绍 (15)

3. 3. 3 基于MCMC算法的混合正态模型的参数估计18 4 总结 (20) 参考文献 (21) 致谢 (23) 1 引言

1.1 研究背景、意义以及研究方法简介


我们现在处在信息爆炸的时代,随着计算机存储能力的不断增加、人们对事物认识能力的提高,如何在大量的数据中发现有用的信息,模式和知识成为了焦点问题。人们发现用单一的模型来研究问题已经显得越来越不足了,为此人们引入了混合分布模型。如今混合分布模型不仅已经成为了分析复杂现象的一个重要的工具并且在各个领域都有广泛的应用(从股票市场的数据分析到建立声学模型),而且它几乎涵盖了各个学科,如:生物、医学经济金融、环境工程域等等。

1.1.1 研究背景及意义

混合模型最早是在带有限方差的随机过程模型中被Clark[1]提出,Epps[2],Tauchen[3]Harri[4]在此基础上对其进行了进一步发展,使得混合模型具有了一定的理论基础。其中有限混合模型[5]提供了为众多随机现象建立统计模型的数学基础。由于该分布的灵活性,无论在理论上还是实践上都受到人们的极大关注。事实上,在过去的几十年里,有限混合模型的应用范围和潜力得到广泛认可。它已成功运用到各个领域。在这些应用中,有限混合模型支撑着这种统计技术,包括聚类分析、判别分析、模式识别、和生存分析等。混合分布模型的提出是为了解决如何在大量的数据中发现有用信息、模式、和知识这一问题。而传统的单一分布很难有效地解决这个问题。不同的混合分布模型应有于不同的领域,


其中混合泊松分布在医学领域有广泛应用;混合指数分布在工程领域里有一定应用;而混合正态分布应用最广,因为许多随机现象在样本量足够大时都可以用正态分布逼近,并且混合正态分布模型也具有灵活高效的拟合能力。

Gelffrey[5]详细介绍了有限混合模型及其应用,该书用EM算法和贝叶斯方法对混合模型进行拟合,给出了多元正态分布混合、非正态分支密度混合、多元t分布混合以及因子分析混合的拟合,并用EM算法对截断多维数据的有限混合模型进行拟合,另外还讨论了一维和多维情形下的隐马尔科夫模型。LavineWest[6]讨论了如何将判别和分类的贝叶斯方法用于正态混合模型,其后验概率通过迭代的二次采样方法获得,对于混合模型参数估计问题,Bilmes[7]已用基于极大似然估计的EM算法实现了正态混合模型的参数估计;后来,Figueiredo等人

[8]又用改进的EM算法对混合正态分布模型的参数进行了估计,在混合模型假设检验问题上,Chen等人[24][25]具体讨论了混合高斯分布的假设检验问题,得到了在原假设成立的条件下,统计量的性质以及渐进分布;Carel[11]把似然比检验的渐进理论应用在了混合模型当中,并得到了假设检验统计量的性质及其势函数。 1.1.2 研究现状

近年来,越来越多的学者致力于研究混合模型参数估计问题,


Gelffrey[12]利用EM算法对有限正态混合模型进行了参数估计,并给出了具体例子;凌燕[13]分别用矩估计法、聚类法、贝叶斯估计法、Louis算法和EM算法讨论了不同情形下的混合分布的参数估计和置信区间估计;谢勤岚[14]介绍了EM算法实现混合密度极大似然参数估计的步骤,并给出了一个参数估计的仿真实例;张香云等人[15-17]在文献中运用吉布斯抽样方法,推导出正态混合模型参数估计的迭代公式,并进行了随机模拟,得到了较好的效果;并以贝叶斯原理为理论依据,对有缺失数据的混合模型,用EM算法推导了参数估计迭代公式;此外又将EM算法应用到隐马尔科夫模型的参数估计问题中。颜建平[18]分别用EM算法、SEM算法和EM-Raphson算法对广义Gamma混合模型进行了参数估计,EM算法和SEM算法的性能进行了比较;邹艳辉[19]在混合分量个数已知的情况下,给出了基于MCMC 算法的高斯混合模型参数估计的理论推导和相关仿真。然而,以上所述的混合分布中的分量都具有单一的分布,只是其中参数的取值可能不同,多层模型是把事情分层考虑来建立模型,这样就可以用一系列相对简单的模型来描述复杂的过程,往往能使问题更易于理解;“混合分布”通常指的是多层模型导出的分布,因此,多层模型也是一种混合模型。

人们对多层模型的研究已有近40年的历史RaudenbushBryk[20]在文献中详细的回顾了多层模型的发展史,通常,


调查数据时,由于经济条件等限制因素影响,而通过分步骤、多层次的设计方案收集样本,这就使得所调查的数据具有分层结构。往往在分析这类数据时,传统的方法只是对个体进行分析,而忽略了组群效应,使得结果出现偏差,甚至推断错误,多层模型非常适合对多层数据进行分析,克服上述缺点,从而获得更加可靠的、接近实际的参数估计和假设检验。因此,恰当的应用多层模型往往能获得传统统计方法难以获得的结论。

国内外许多学者通常运用多层模型来研究中国的实际问题。付晓光[21]运用多层次模型从个体层次和家庭层次两个方面分析了影响农村居民医疗服务利用的主要因素;殷守敬等[22]将多层次模型方法引入到血吸虫传播风险因子识别研究,探讨了影响血吸虫传播的因素;杨菊华[23]介绍了多阶模型的基本原理,并用2000“中国健康和营养调查数据展示了多层次模型在社会科学领域的应用;洪岚 [24]

通过主成分分析,构建贝叶斯多层模型,对杭州西湖富营养化风险进行了评价;

王克林等人[25]将多层模型应用到各地区消费差异的研究中,通过引入微观层面的家庭人均可支配收入和是否拥有住房虚拟变量来解释微观层面的家庭消费差异。 2 混合模型


2.1 混合模型的简要介绍 假设)

n x x X ,,1 =为一组样本观测值,来自具有k 个混合分量的混合密为 ==k i i i x f x p 1)()(ω )1(

在这里)k ωωω,1 =称为混合分量的权值,且对于任意i ω满足10≤≤i ω,k i ,2,1 =11 ==k

i i ω。其中最为常见的形式有正态分布、指数分布、泊松分布。

在实际应用中,各混合分量的概率密度函数)(x f i 都属于一个确定的函数密度的

参数集,所以,混合分量的概率密度函数)(x f i 也可以表示为);(i x f θ,

k i ,,2,1 =,其中)k θθθθ,,,21 =是一参数向量,i θ为第i 个混合分量的参数,于是公式(1)也可以表示成如下形式:

1122(|,)(;)(;)(;)k k p x f x f x f x ωθωθωθωθ=+++

混合模型是一个强有力的概率工具,主要表现在以下三个方

1) 它提供了一个利用简单结构拟合复杂密度的方法。只要


混合分量的个数足够

大,正态混合密度可以任意的逼近一个光滑密度。 2) 混合模型提供了一种模型同质性和异质性的方法。我们发现当k=1时,混合

密度总体是一个单一的密度,因此数据是具有相同性质的,即同质性。当k>1时,密度总体包含多个混合分量,反映了混合数据的异质性。

3) 即使混合元没有明确的表达形式,混合模型在参数框架下也提供了一个非常

可行的建模环境。它不但具有参数模型的解析优势,而且还拥有非参数模型的灵活性,从而拥有更多的建模优势。 2.1.1 感兴趣的问题

在混合模型的研究中人们常常关心以下几个问题: 1) 基于极大似然方法的改进。这是因为在函数无界的情况下,极大似然估计就

失去了意义,此外在某些特殊情况下,混合模型的似然函数具有几个局部的

极值点,如何选取极值点也比较困难。

2) 在混合分布模型的应用过程中,我们通常假设各混合分量的分布为正态分

布,来简化模型的应用而在实际中,我们所碰到的问题里,各混合分量不完全是正态分布。而且有时各分量的分布我们


根本不知道,如何解决这一问题还有待研究

3) 混合模型的参数估计问题。有时混合模型的参数估计比对它本身的估计更有

效些,这样就能更近一步来了解混合模型。本文也主要针对参数估计问题展开了讨论。 2.1.2 缺损数据的形式

为了在实际研究中更方便,先介绍一下混合模型的缺损数据形式。假设样本观测值i x 来自于一个未知的混合分量i z 其中12,,,n z z z 是一组随机变量,它表示样本观测值i x 来自于各混合分量的个数,它们之间是相互独立且同分布的,且有

Pr(|,).i j z j ωθω==1,2,,;1,2,,i n j k ==

从而在条件12(,,,)n z z z z = 下,12,,,n x x x 相互独立,来自于密度函数

(|,,)(;),1,2,,;1,2,,.i i i i p x z j f x i n j k ωθθ====

因此,结合缺损数据。我们可以推出下式: 1(|,)Pr(|,)(|,,) k

i i i i j p x z j p x z j ωθωθωθ====


1 (;) k

j i i j f x ωθ==

2.2 主要研究方法介绍 2.2.1 极大似然法

用极大似然法来估计混合模型的参数(,)ωθ,其实就是通过选择 (,)ωθ来使 得混合模型的似然函数 =++=n

i k i k i x f x f X L 1

11)};();({),(θωθωθ 2-1

达到极大值。那么此时 (,)ωθ就是(,)ωθ的极大似然估计。故可用 (,)ωθ来替换

(,)ωθ。这样就可以计算出我们所感兴趣量的估计值,比如:密度(|,)p x ωθ就可以被估计为

(|,)p x ωθ。尽管极大似然估计方法很常用,但它在估计混合模型的

参数时却存在一定的困难。其原因主要是由于对很多函数族f 而言,2-1)式是无界的,从而不能对用极大似然法对参数来进行估计。例如:如果考虑单变量的正态混合模型,其似然函数为


=++=n

i k k i k i x N x N X L 122111)},;(),;({),(σμωσμωθ 2-2

如果我们令11x μ=,且允许2

1σ趋于零,则式(2-2)的极大似然函数会趋于无穷 大。虽然在实际应用中我们可以通过约束各混合分量的方差相等来避免这个问题,但这样的约束也并不总是合理的。并且我们发现如果直接求导计算使混合混 合正态似然函数式2-2)达到最大的),(

θω,有一定的计算困难,在本文后面的章节中我们会针对该计算介绍一种EM 算法来解决这个困难。 2.2.2 贝叶斯分析法

采用贝叶斯分析法,我们可以避免极大似然法中出现的问题,对于我们感兴趣的量,取其在参数空间上的均值,参数的密度取其后验分布。比如,在本文中我们只研究混合分量 k 为已知的情况,取参数先验分布为),(θωπ,则通过贝叶斯定理,我们有参数的后验分布:)|,(X p θω,那么在样本数据X 给定后,预测密度(将来观察值的密度)也可以由下式表示

11(|)(|,,)(,|)n n p x X p x X p X d d ωθωθωθ ++=?


原则上,我们对所有感兴趣的量的估计都可以表示为下式积分的形式

θωθωθωθωd d X p F X F E ?=)|,(),()|),(( (2-3 虽然贝叶斯方法弥补了极大似然方法的不足,但是这个方法本身也存在着一定的问题。如:

1.计算问题。贝叶斯计算的方法有很多,总的来看分为两类,一种方法就是直接应用后验分布,利用后验分布的均值或众数作为估计值,但它只能应用于较为简单的后验分布的情形,对于复杂的后验分布,积分起来非常困难。另一种方法就是后面EM 算法中所介绍的数据添加法,方法原理与前面都一致,在这里

就不再赘述了。 在混合模型的贝叶斯分析中,由于(2-3式的积分形式过于复杂,我们无法得到它的解析解。因此可以引入位置变量Z ,我们称),(Z X 为完整数据,假定Z 知,那么我们就可以得到后验分布),|,(Z X p θω,然而又有 (,|)(,,|) Z

p X p Z X ωθωθ= (,|,)(|)


Z

p Z X p Z X ωθ= 其中z

Z 表示对),,(1n z z Z =的所有情况求和,因此有n k 项,那么参数的后验 分布就有n

k 项,那么对于较大的n 我们就难以处理。

在混合分量个数已知的情况下,我们可以利用MCMC Markov Chain Monte Carlo )方法来对(2-3)式中的积分进行逼近。在本文的后面的章节中我们给出了正态混合模型的MCMC 算法。

2.参数先验的选取。在运用贝叶斯分析问题时,参数先验分布的确定是一个有争议的问题。而在混合模型的贝叶斯分析中,同样也遇到了这样的问题。我们更多关注的是在混合模型没有先验信息的情况时,如何选取参数的先验分布。也就是所谓的无信息先验分布。在贝叶斯统计诞生之日开始就伴随着一个“没有先验信息可利用的情况下,如何确定先验分布?”的问题。出于贝叶斯方法的吸引力和完善贝叶斯方法的愿望,不少统计家参与研究了这个问题,经过几代人的努力,至今已提出多种无信息先验分布。如,由Jeffrey 先提出的位置参数的无信息先验和尺度参数的无信息先验。而在本文中我们对正态混合模型采用多层先验分布,给出了


参数的一个正常先验。

3 混合模型的参数估计

3.1基于EM 算法的混合正态模型的参数估计 3.1.1 EM 法的简单介绍

EM 算法(期望极大化算法):有时在统计推断时,我们很难直接对某式进行统计计算,所以我们通常采用的方法是数据添加法。该方法不是直接对复杂的后验分布进行极大化或模拟而是在已有的观测数据上添加一些不能观测到的潜在数据,从而使得后验分布变得简单,便于我们完成极大化或者模拟。这些潜在数据可以是缺损数据或者是未知参数,其原理可以简单的总结如下:在上文叙述中,假定X 为我们所观察到的样本观测值,θ是我们所感兴趣的参数,θ关于X 后验分布)|(X p θ十分复杂,难以进行各种统计计算,但假如我们假定一些没有被观测到的数据Z 潜在数据)已知,那么就可以得到一个关于θ的简单的后验分布),|(Z X p θ,利用简单的后验分布我们就可以进行各种统计计算,如极大化,抽样等。然后反过来我们又可以对假定做出检查和修正。 EM 算法是一种迭代方法,主要用来求极大似然估计或后验分布众数。该法的每一次迭代分两步组成,E 步(求期望)M 步(极大化)。一般地,记θ为后验分布的众数,)(i θ表示第i 次迭代之后的估计值,且作为第i+1次迭代的初始


值。观测后验分布)|(X p θ与添加未被观测到的数据Z 得到的简单后验分布

),|(Z X p θ,我们前面已经介绍过,现假设在给定θ和观测数据X 下潜在数据Z

的条件分布为),|(X Z p θ那么EM 算法的第i+1次迭代就又如下两步组成: E 步:将),|(log Z X p θ关于Z 的条件分布求期望,从而把Z 积掉,即

()()()(|,)[log (|,)|,]log[(|,)](|,)i i i Z Q X E p X Z X p X Z p Z X dZ θθθθθθ=?

M 步:将E 步中的),|()(X Q i θθ极大化,也就是找到一)1(+i θ,使得

(1)()()(|,)max (|,)i i i Q X Q X θθθθ+=

至此完成了由)1()(+i i θθ的一次迭代,重复以上步骤,直至i i θθ-+1或者

),|(),|()()()()1(X Q X Q i i i i θθθθ-+充分小时,迭代停止。

3.1.2参数估计的理论推导

下面我们利用EM 算法对k 阶混合正态模型进行参数估计。 假设),...,(1n x x X =为来自以下k 阶一元混合正态分布模型 222


112211()()11 (|,,)exp[]exp[] 2222k k k k

x x p x μμμσωωωσσπσπσ--=-++- 3-1 的样本,现在我们引入潜在数据i j Z 。当j x 属于第i 混合分量时1=i j Z ,否则

0=i j Z ,易知在),...,(1k j j j Z Z Z =中,只有且只有一个是1 那么1(,,)n X x x = 1(,,)n Z Z Z = 联合分布的密度函数为: 22 2 1 1()1

(,|,,)[exp[]]22j i n k

Z j i i i j i i x p X Z μωμσωσπσ==-=-∑∏ 假设2,,ωμσ相互独立,且它们的联合先验分布2 (,,)1πωμσ=,那么则有 22 2 2 1


1()1

(,,|,)(,|,,)[exp[]]22j i n k

Z j i i i j i i x p X Z p X Z μωμσωμσωσπσ==-=-∑∏ 那么

2()()2()2()()2()(,,|,,,)log (,,|,)(|,,,)

m m m m m m Q X p X Z p Z X =? ()2() 2 2()()()2 211 ()2()()1 ()1exp[]()221 log{exp[]}() 221exp[] 22m j i m i m m n k j i i

ωμσωμσωμσωμσ
i i m k j i j i i m i i m m i i i

x x x μω μσπσ ωμσπσωσ πσ ===-- -=--- ∑∑∑ 其中

()(1)()()(1)()2()(1)()111{,,},{,,},{,,}m m m m m m k k k ωωωμμμσσσ=== 为第m 次迭代值,m=0,1,2 2()()2()

(,,|,,,)m m m Q X ωμσωμσ求导就可得到第k+1次的迭代值。

首先对i ω,l=1,2,,k 求导


2()()2()[(,,|,,,)]0m m m l Q X ωμσωμσω? =? ()2 ()2() () ()2 1 ()2() ()1

(1)()1exp[] 22()1exp[] 22m j l m l m m n l l m k

j j i m i m m i i m i l x x n

μωσπσμωσπσ ω==+-- -- =




同理对i μ,l=1,2,,k 求导 2()()2()[(,,|,,,)]0m m m l Q X ωμσωμσμ? =? ()2 ()2() () ()2 21 ()2()() 1 ()1exp[] 2()220()21 exp[]

22m j l m l m m n j l l l m k j j i l m i m m i i

i x x x μωμσπσμσ ωσπσ==--


-=-- ()2 ()2() () ()2 1() 2()() 1 (+1) ()2 () 2()() ()21() 2()() 1()1 exp[]

22()1exp[]22()1exp[]22()1exp[]22m j l m l m m n l l j m k


j j i m i m m i i m i l m j l m l m m n l l m k j j i m i m m i i i x x x x x μωσπσ

μωσπσμμωσπσμωσπσ====-- --=----∑∑∑∑

再对2i σ,l=1,2,,k 求导 2()()2()2[(,,|,,,)]0 m m m l

Q X ωμσωμσσ ?=?()2 () 22() ()()2 22 2 1 ()2() () 1 ()1exp[] ()221


[ ]0

()2()21exp[]22m j l m l m m n j l l l m k j j i l l m i m m i i i x x x μω μσπσμσσω σπσ==-- -- =--∑∑ ()2() 2() ()(1)2()2 1 () 2()()


1 2(1)()2 ()2()() ()2 1() 2()() 1()1 exp[]22()() 1exp[] 22() 1

exp[]22() 1exp[] 22m j l m l m m n m l l j l m k j j i m i

m m i i k i l m j l


m l m m n l l

m k j j i m i m m i i i

x x x x x μω

σπσμμωσπσσμ ωσπσμωσπσ+==+==-- --- =

----∑∑∑∑

(1)()(1)()2(1)2()

,,m m m m m m l l l l l l ωωμμσσ+++---充分小(可 2

,,ωμσ的


222

111(,,),(,,),(,,)k k k ωωωμμμσσσ=== 3.2 基于SEM 算法的混合Gamma 模型的参数估计 3.2.1 SEM 算法的介绍

1977EM 算法被提出以后,一直受到学术界的广泛关注。之后又有学者对EM 算法作了进一步的改进和完善,形成了一系列的扩展算法。其改进的算法是在原有的EM 算法的E 步或M 步的基础上形成的。如在EM 算法E 步中,有时要获取条件期望的显式表达形式是不可能的,即使是近似计算也很困难,这时可以采用蒙特卡洛(Monte Carlo )方法来完成,这就是在1990年提出的MCEM 算法,SEM 算法是MCEM 算法当抽取到的随机数为1是的一个特例。

SEM 算法最早是在1985年提出来的,通过增加随机步来改EM 算法,使其收敛速度快、不需要预先知道具体混合分量数和不依赖于初始参数值。在文献[23]G.C.G.Wei 等人详细讨论了用Monte Carlo 方法的数值仿真分析,验证了SEM 算法的收敛性和抽样大小趋于无穷大的情形。


SEM 算法是EM 算法的改进算法,它在EM 算法的基础上增加了S 步。因此,在每一次的迭代中,SEM 算法由三步组成: E 步:计算条件期望。根据观测数据和混合模型的当前参数值来计算条件期望;

S 步:生成0-1指示矩阵,对每个观测数据,从E 步的条件期望中随机抽取

一个数,确定这个观测数据属于哪一类,即???→→=其它中个观测数据在第 01j i Z i j

从而生成0-1指示矩阵1111k n n k z z z z ?? ? ? ? ?

? M 步,混合模型的参数集更新。将S 步得到的0-1示矩阵代入到Q 函数中,得到混合模型的参数估计方程。 3.2.2 参数估计的理论推导

下面我们利用SEM 算法对两个Gamma 分布的混合模型的参数进行估计。 已知Gamma 分布的概率密度函数为: }exp{)(),|(1σ σκσx

k x x p k k -?Γ=-

其中,+R x 0>σ为尺度参数,0>κ为形状参数,)(x ΓGamma 函数。 那么下面我们给出两个Gamma 混合模型的


定义式:

}exp{)(}exp{)()(2

2212111112211σσωσσωx

k x x k x x f k k k k -?Γ?+-?Γ?=-- 3-2 利用SEM 算法对(3-2)式中的参数进行估计: 1) E 步:计算条件期望,这一步与EM 算法的相同。

2) S 步:生成0-1指示矩阵。对每个观测数据,从E 步的条件期望中随机抽取

一个数生成0-1指示矩阵。即,对于任意一个i,从条件期望中抽取一个随机数m y ,则T ki ji i m y y y y ),,,,(1 =中只有一个等于1(说明该数据属于第j 类),其余的均为0

3) M 步:参数集更新。将S 步中得到的0-1指示矩阵带入Q 函数中,则可以 得到如下表达式: ])|,(log[),(11 =-Θ=ΘΘn i m i t y x p Q =Θ=n i m i y x p 1 )]|,(log[ ==n


j y i y m m x p 1 )]|(log[θω }]|(log[{12

1∑∑===n i j i j j ji x p y θω ∑∑∑∑====+=n

i j n i j j i ji j ji x p y y 12 1 12 1

)]|(log []log [θω 21I I +=

对于混合权重ω的估计是一个条件极值问题,对Q 函数的1I 关于ω求导,引入拉格朗日乘子,得到拉格朗日方程 0}1(]log [{211 2 1

=-+??∑∑∑===j n i j j j ji j y ωλωω j=1,2

解得混合权重的估计方程为: = =n

i ji j y n 1


1ω 2,1=j 3-3

将(3-2)式代入到2I 中得到如下表达式: ∑∑=-=--Γ+-Γ=n i i k k i i n i i k k i i x k x y x k x y I 1

222121111112)}exp(])(log[{)}exp(])(log[{1211σσσσ(3-4

故对(3-4)关于κσ,求导并且令其等于零,得到方程组,并求解方程组,分别得到两个Gamma 分布混合模型的参数j j κσ,的估计方程为: ∑∑== = n i ji j n i i ji j y x y 1 1 )

(κσ 3-5


∑∑=== Γn i ji n i ji j i j j y

y x d d 1 1 ] )[log(

)]([log σκκ 3-6

上式3-33-53-6即为基于SEM 算法的两个Gamma 分布混合模型的参数估计方程。其中式(3-6)的左边为对Gamma 函数求导,通过二分法求解该方程的根,从而得到j κ的估计值。

3.3基于MCMC 算法的混合正态模型的参数估计 3.3.1 二阶混合正态模型的贝叶斯估计

下面我们利用贝叶斯方法对k 阶一元混合正态模型进行参数估计。首先我们先来给出在后面计算中会遇到的定理以及公式:

定理3-1:在给定先验分布)(θπ和平方损失函数2)()(θ


δδθ-=-L 下,θ的贝叶斯估计是其后验均值)|(x θπ,)|(x E θθ=

公式3-1? ---Γ=-01 ,)

1()exp(a a b a dy y b y a>0,b>0 公式3-2:∑∑∑∏==- -+=- -+l j i l n l l n

i i j x q x q 1 ) (1 2 11 2)]1 1


(exp[1)]}1 1 (

exp[1{θθ θθ 其中l l n i n i n

i i i i l (11 1

,1221,θθ为混合分量中的参数

我们先看简单情形下的贝叶斯估计,即k=2时。此时二阶一元混合正态分布模型为: ]2)(exp[21)1(]2)(exp[21)|,,(2 22 22 212112

σμσπωσμσπωσμω---+--=x x x p 当ω已知,021==μμ时;

假设),,(1n x x X =是来自二阶混合正态分布的样本,则样本的联合密度函数为


=--+-=n i i i x x X p 1 222221212 )]2exp(21

)1()2exp(21[)|(σσπωσσπωσ =---+-=n

i i i i x x x 1212 1 222 2 21 21]}

2exp(21)2exp(21

)1(1)[2exp(21{σσπωσσπωσσπωn i i i n i i n n n

x x x 12122222 1 121212

==+--+-= ∏∑
)]22exp()1(1[])2(exp[)2(σσωσσωσσπω ,22

21212,,h h h ===σσσ则 ∏∑==+--+-=n i i i n i i

n n h x h x h h h x h h X p 112222 1 2211 1 12

21)]22exp()1(1[])2(exp[)2()|(ωωπω 运用公式2将上式展开得:

}2121exp(1]{)2(exp[)2()|(112121122 1∑∑∑∑===+-+-= n i l n s i l n i i n n

s x h h b h x h h X p πω ),,)1((2111


1 212 21 1 12l l n i n i n i i i i h h

b l ∑∑∑∑=== ωω 假设参数1

221,σσ先验分布服从倒伽玛分布),(i i IGamma βα0,0,>>i i βα,其中i i βα,的取值可以从经验中得到。2

221,σσ是验前相互独立的,则有联合先验密 度函数

])(exp[][])(exp[][),(2 121 ) 1(2 122 1 )1(222


2 1

∑∏∑∏==+-==+--=-i i i i i i i i i i h h i i βσβσ σσπαα ) 2exp() 2() ()|,(2 111 2 2 12 1)

1(21∑∑∏===+---∝∴i n i i i i n n i i h x h h h

X h h i βπωπα}2121exp(b {1n


1l )(1 2 12l

∑∑∑==+-+l l s i s x h h

考虑在平方损失函数的情况下,由定理3-1知贝叶斯估计是其后验密度函数的均值,即: ?? = =- ==00 212111121

)|,(i i dh dh X h h C h h πσ ??∑∞===+-+---+-=002 2112 1)1(2)2(1 2 1

)21{exp() 2(21i i n i i n n


n

h h x h h C

ββπωαα )}21exp()2121exp()()1(21 2

211212121211)(h x h x x h h l s i l s i n i i l n l l s s ∑∑∑∑∑====+--+--+ββωω 其中 200

121)|,(h d dh X h h C i i ? ? = ==π

利用公式1可得: 2122)12 (11212121 )()2 ()

12({)2(αααβαπωσb x n

C n n i i n n


Γ+-+Γ??=-+=-∧∑ }21() 21()2

21()1212()1()2(1222)122(1211211) (21l l s i l n n i i l s i l n

l l s s x x x n +=--+===∑∑∑∑∑++Γ?++--+Γ?-+ααβαβαωω 同理可得22σ的估计 ? ? =- = ?==02110 2222

)|,(i i X h h C h h πσ ??∑∞===-++---+-=002 2112 12)12(1 2 1

)21{exp()


2(21i i n i i n n n

h h x h h C ββπωαα )} 21exp()2121exp()()1(21 2

211212121211)

(h x h x x h h l s i l s i n i i l n l l s s ∑∑∑∑∑====+--+--+ββωω1222 11212122 11)1()2 ()

2({)2(-+=--Γ?++Γ??=∴∑αααβαπωσb x n

C n n i i n n })

12()2()22()1(1 )12(222)22(1211211)

(21∑∑∑∑∑=-+-+===+-+Γ?++-+Γ?-+l s l i l n n i i l s i l n

l l s s x l x x l n βαβαβαωω( 这样我们就得


到了在均值为零时2i σ,i=1,2的估计值,但在实际情况中均值一般都不为零,这时我们可以做一个变换,X X X -=*那么可以近似的将*X 的均值看作零。 3.3.2 MCMC 算法简单介绍

当混合分量个数k 大于2时,由于式(2-3)的表达式十分复杂,无法对其直接进行计算。此时我们就可以利用MCMC Markov Chain Monte Carlo )方法来对(2-3)式中的积分进行逼近。人们又称该方法为动态的蒙特卡罗(Monte Carlo )方法。实际上它就是一个产生随机数的机器,采用动态的构造马尔科夫

Markov )链的方法来产生一些服从任意分布的随机样本。运用MCMC 方法来解决贝叶斯估计的问题,也即解决式2-3的计算问题。当后验分布十分复杂时,我们无法为出2-3式的积分。这时就要采用蒙特卡罗积分方法来处理这个问题,如果能够从(|)p X θ中产生一组具有独立同分布的随机数,

)(~,,),,,()()2()1(θπθθθd i i M ,那么由大数定律就可以保证,样本的一阶距一定是收敛的,并且收敛到它的数学期望。那么公式(2-3)的积分问题就转化为从后验分布函数)|(X p θ中选取独立同分布的随机数,产生样本后,通过对样本的一阶距计算来估计式(2-3)的积分值。即 =


= M m m F M F E 1 ) ()(1 ))((θ θ (3-7)

而在实际问题中,如何从)|(X p θ中抽取样本是一个难点。下面我们利用构造转移核的方法来建立马尔科夫(Markov ,使其达到平稳分布。当马尔科夫(Markov )链收敛后,我们就可以在其中挑选任意多的样本利用蒙特卡罗积分求得式(2-3)的积分值。

我们假定}{S t 表示一个随机变量序列,定义该序列的状态空间为所有序列的可能取值范围。如果序列}{S t 的条件概率密度函数),,|(01s s s p t t +满足

)|(),,|(101t t t t s s p s s s p ++= 。即,序列的当前状态只与上一状态有关而与它过去的状态无关。我们称这样的序列为马尔科夫(Markov )链。显然,如果我们想预测该链的未来状态,那么就只需要知道该链的当前状态就可以了。其中我们称条件概率密度函数)|(1t t s s p +为转移核,将从时刻t 的状态t s 转移到时刻t+1的状态1+t s


的概率记为),(1+t t m s s T 。由此可见,如果想要构造一条马尔科夫(Markov )链,那么只需要确定起始分布以Markov ,则转移核就与时间无关。记为),('s s T 。由著名的查普曼-卡尔莫格罗夫方程,我们可以得到t+1时刻的分布)('1s p t +

ds s p s s T s p t t ?=+)(),()(''1 如果分布)(s π满足

?=ds s s s T s )(),()(''ππ

那么称)(s π为马尔科夫(Markov)链的不变分布。一条马尔科夫链可能存在多个不变分布,然而在实际应用中,我们更加关心的是存在唯一的不变分布的马氏链。而细致平衡条件恰好给出了存在唯一不变的马氏链的充分条件,即只要转移

),('s s T 满足

),()(),()('''s s T s s s T s ππ=

那么由其构造的马氏链将具有唯一的不变分布。对于一条存在唯一的不变分布的马氏链,它经过充分长时间的迭代后,马氏链将收敛于唯一的不变分布)(s π,这

时候的马氏链是各态历经的,且其不变分布)(s π被称为平稳分布,起始分布和

)(s π之间的马氏链的数据成为burn-in 在蒙特卡罗积分


中这部分数据将被舍弃,不用作计算积分值。在MCMC 方法中,关键点与难点就在于如何构造转移核,最常用的方法就M-H 算法与吉布斯(Gibbs)采样法。在本文中我们简单介绍一下这两种方法。

M-H 算法的主要目的就是要获取目标分布)(θπ的样本。首先,我们利用某种方法选取起始点)0(θ,满足0)()0(>θπ,然后,按如下步骤进行迭代来产生整个马氏链:

1) t-1)1(-t θ)|()1(-*t q θθ(表示在已知)1(-t θ的

情况下通过采样的到的*θ概率)中随机采样产生一个候选*θ。 2) 计算候选点*θ的接受概率 () ()

(1)(1)(1)(1)()|(,)min{1, }

()|t t t t q q πθθθαθθπθθθ*-*-*-*-= 3) (0,1)上的均匀分布中产生一个随机数m ,若),(1*-*θ,设置)()(*=θθt ,否则令)1()(-=t t θθ。 从上面的算法描述中我们不难看出,该算法从状态θ到*θ的转移核为

),()|(),(***=θθαθθθθq T ,而且我们不难证明算法的转移核),(*θθT 满足细致平衡条件,从而说明了在经


过充分长的迭代后,M-H 算法可以使马尔科夫(Markov)链最后收敛到目标分布)(θπ。

理论上,建议分布的选取是任意的。但在实际过程中,建议分布的选取对M-H 算法的效率的影响还是很大的。一般情况下,建议分布的选取应该与目标分布越接近越好。如果在M-H 算法中,选取的建议分布)|(θθ*q 不仅满足对称性,且只*-θθ有关,于是该算法就变成了通常情况下的随机游动M-H 采样法。实现M-H 算法的另一个重点就是它的起始点的选取。如果起始点选取不恰当,就会导致burn-in 阶段的长度增加,从而使得马氏链的收敛速度降低。一般情况下,尽量将距离目标分布中心比较近的值作为起始点或者从各参数的先验分布中产生。

吉布斯(Gibbs )采样法实际上就是M-H 算法的一种特例,M-H 算法中的建 议分布)|() 1(-* t q θ θ取为)|() 1(--*t i

i θθπ,i=1,2,...,k,其中-i 表示除了i 的其他分量,此时候选点的接受概率恒定地等于1。吉布斯(Gibbs )采样法的主要思想就是将一个高维采样转化为哦连续多个低


维采样。

假设我们的目标是要获取目标分布)(θπ的样本,这里θ是k 维向量,即

],,[1k θθθ =(Markov)],,[)0()0(1)0(k θθθ =,吉布斯

Gibbs )采样法在每一次的迭代中,通过连续对各个分量i θ从相应的满条件分

布中采样来构造整个马尔科夫(Markov)链,对于第i 此迭代,假定开始时的估计值为)1(-i θ,那么吉布斯(Gibbs )采样第t 次迭代分成以下k 个步骤: 1) 由满条件分布),,,|(1121 ()--t k

t n x θθθπ 抽取)(1t θ; ....... 2) 由满条件分布),,,,,,|() 1()1(1)(1)(1--+-t k

t i t i t n i x θθθθθπ 抽取)(t i θ; ...... 3) 由满条件分布),,,|()(1)(1t k t n k x -θθθπ )(t k θ。

由上面k 步,容易得到吉布斯(Gibbs )采样法的转移核为

随着迭代次数的增加,当马尔科夫(Markov)链达到平稳状态后,所得到的样本


)(k θ将服从于目标分布)(θπ。

在计算(3-7)式的值时,为了减少由(3-7)式给出的估计值对

=-->i t j t j t i t t i j i j T 1 )1()()() ()

1(),,,|(),(θθθπθθ 起始点的依赖性,

需要扔掉起始点的n 个样本点,n 值得选取与所构造的马尔科夫(Markov)链的收敛速度有关。如果马尔科夫(Markov)能够在较少次数的重复采样后就收敛,n 的取值可较小;但如果马尔科夫(Markov)链在很多次数的重复采样后才得到收敛,则n 的取值就会比较大。关于选择n M 值得方法已经有很多,例如Geweke 测试,这种方法首先将起始的burn-in 数据去掉,然后将剩下的数据分为两部分:即开始数据的10%和最后的50%。如果马尔科夫(Markov)链达到稳态,则两部分的均值就会相等。在扔掉初始的n 个样本点后,式(3-2)中估计值应变为 += -=M

n m m F n M F E 1 )()(1


))((θθ 3-8

3.3.3 基于MCMC 算法的混合正态模型的参数估计 我们下面来简单的讨论一下k 阶一元正态模型,对模型参数用吉布斯Gibbs 采样法进行采样,建立马尔科夫(Markov)链,由(3-8)做出统计推断。 同样我们假定数据),(,1n x x X =来自于具有k 个混合分量的一元正态混合总体如式2-1。首先要解决的是参数先验的选取问题,本文中我们采用多层先验分布。我们选取参数先验分别为: ),(~1-κξμN i ),(~|2βαβσΓ-i ),(~h g Γβ ),,(~1k D δδω

这里),(λn Γ表示Gamma 分布,),,(1k D δδ 表示参数),,(1k δδ Dirichlet 分布。其中β是一个超参数,δβακξ和h g ,,,,,都是常数,它们的值由下面的式子确定:

R=研究数据区间的长度,=ξ所研究数据区间的中点,2 1 R =κ,2 100R g h α=


δα,,g 根据具体情况来定。由参数的先验分布我们可以求得各参数的满条件分布,如下所示: ),(~|2-++Γi

i h g σκαβ )n ,,n D(~|k 1++δδω ))(,(

~|1222----+++∑κσκ σκξ σμi i i i j i i n n x N )2 )

(,2(~|2

-++Γ-i j i i x n μβασ

其中),,2,1(k i =),,2,1(n j =。由前面介绍的MCMC 法对以上各参数进行循环抽样时可以构造一个马尔科夫链,且最后收敛到一个平稳分布。抽样结束后我们就可以利用3-8)进行各种统计推断。 4 总结

首先我们简单地介绍了混合模型以及研究混合模型的两种主要方法,之后基于EM算法对混合正态模型进行了参数估计的理论推导。我们发现虽然EM算法有算法简单易理解,


且易通过编程来实现的优点。但该算法对初值的依赖性较大,且收敛速度慢。因此我们提出了改进之后的SEM算法,即在原来EM算法中加入了随机步来改善EM算法,使其收敛速度快,且不依赖于初始参数值。并利用该算法对两个Gamma合模型的参数估计进行了理论推导。最后我们采用贝叶斯估计对二元正态混合模型的参数进行了估计,以及对基于MCMC算法的混合正态参数模型的参数估计的过程做了简要的介绍。通过运用不同的方法对混合模型的参数估计进行理论导,为其在实际中的运用奠定了理论基础。 参考文献

[1]Clark P K. A subordinated stochastic process model with finite variance for

speculative price[J].Econometrica,1973,41(1): 135155.

[2]Epps T W, Epps M L. The stochastic dependence of security price changes and transaction volumes implications for the mixture of distribution hypothesis[J]. Econometrica, 1976,44(2): 305-321. [3]Tauchen G, Pitts M. The price variability-volume relationship

of

speculative

markets[J].

Econometrica,1983, 51(2): 485-505.

[4]Harris L. Cross security test of the mixture of


distribution hypothesis[J].

Journal of Financial and Quantitative Analysis, 1986,21(01): 39-46.

[5]McLachlan G J. Finite mixture models[M]. New York: Wiley h Sons, Inc, 2000.

[6]Lavine M,West M. A Bayesian method for classification and Discrimination[J]

Canadian Journal of Statistics, 1992, 20(4): 451-61. [7]Bilmes J. A gentle tutorial of the EM algorithm and its application to parameter estimation for Gaussian mixture and hidden Markov models[R]. California: TR-97-021, 1998.

[8]Figueiredo MAT, Jain A K. Unsupervised learning of finite mixture models[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002,24(3): 381-396.

[9]Chen H,Chen J, Kalbfleisch J D. A modified likelihood ratio test for homogeneity in finite mixture model[J]. Statistical Society, 2001,63(1): 201-215. [10]Chen H , Chen J. Large sample distribution of the likelihood ratio test for normal mixtures [J]. Statistics & Probability Letters, 2001, 52(2): 125-133.


[11]Garel B. Asymptotic theory of the likelihood ratio test for the identification of a mixture[J]. Journal of Statistical Planning and Inference, 2005, 131(2): 271-296. [12]McLachlan

G

J.

The

EM

algorithm

and

extensions(second edition) [M]. New York: Wiley & Sons, Inc,2008, 61-65.

[13]凌燕.混合模型中的参数估计问题[D].上海:华东师范大学,2006.

[14]谢勤岚.基于EM算法的混合模型的参数估计[J].计算机与数字工程,2006,34(12): 42-44.

[15]张香云,宋红凤.基于Gibbs抽样正态混合模型的参数估[J].统计与决 ,2009,285(9):28-29.

[16]张香云.基于EM算法缺失数据下混合模型的参数估计[J].中国管理科学,2011, 19:79-83.

[17]张香云,张秀伟.基于EM算法隐Markov模型参数估计[J].大学数学,2008,24(3): 53-56.

[18]颜建平.广义Gamma混合模型的参数估计研究[D].成都:


西南交通大学,2011.

[19]邹艳辉.基于MCMC的广义Gamma混合模型的参数估计及应用[D].成都:西南交通大 ,2012.

[20]Raudenbush S W, Bryk A S. Hierarchical linear models: applications and data analysis methods(second edition) [M]. Newbury Park, CA: Sage, 2002. [21]付晓光.多层模型在农村居民医疗服务利用影响因素分析中的应用[J].中国卫生统 ,2013,30(3): 385-387.

[22]殷守敬,陈晓玲,胡海棠.多层模型方法及其在血吸虫病传播风险因子识别研究中的应

[J].中国卫生统计,2007, 24(6): 572-575. 致谢

本科生涯即将结束,经过多番努力,值此论文完成之际,回想这四年生活的点点滴滴,内心感慨万千。谨向所有给予我关心、指导、支持与鼓励的老师、学长、同学们表达我诚挚的谢意。

首先,向我的导师吴黎军老师致以深深的敬意和由衷的感谢,感谢吴黎军老师的悉心指导。吴黎军老师具有严谨的工作度、一丝不苟的钻研精神,他渊博的学识、高深的学术造诣和实事求是的治学作风使我受益匪浅。我的文章从最初的论


文选题、数据整理、模型建立和改进到最终论文的撰写和修正,每一个过程都有老师耐心的指导和帮助。无论是为人还是治学吴黎军老师都是我终身学习的榜样。

同样感谢师兄师姐们不厌其烦的答疑解惑、倾囊相授,本专业同学们学习和生活中的帮助。感谢宿舍和班级的每个成员,营造了良好的学习和生活环境,你们积极探讨交流,认真学习的态度使我收获颇多,获益匪浅,让我度过了本科阶段难忘的美好时光。

最后特别要感谢我最亲爱的父母和家人。这么多年来,他们一直无私奉献。无论生活或学习、物质或精神上,他们的关爱、支持都是我不断进步的动力和源泉。我会继续努力,不辜负大家的期望,用丰厚的成果报答你们。 再次感谢大学期间所有给予我帮助的人。

新疆大学本科生毕业论文(设计)评议书学院:数学与系统科学学院

论文(设计)题目: 混合模型的贝叶斯分析与选择

学生姓名: 蔡敏专业: 数学应用数学班级:应数11-1 指导教师姓名: 吴黎军职称: 教授 评价内容具体要求得分

方案论证(15分)能独立查阅文献和课题调研,能提出较科学、合理、可 行的实施方案。13


论文(设计)内容(30分)坚持实事求是科学态度,没有造假和抄袭行为。观点、

结论正确、论证充分、设计合理。内容与专业要求相吻合,理论与实际联系紧密。25

工作量和难度(20分)遵守毕业论文(设计管理制度,按期完成任务书规定

的内容,工作量饱满,有一定难度。16

论文(设计)质量(20分)结构合理、条理清楚、文理通顺、用语符合专业要求;

文体格式规范图表清楚。图样绘制与技术要求符合国 家标准,图面质量符合要求。16 创新性与应用价值

15分)具有一定的创新性和应用价值。13 总分100分)83 指导教师评语:

该论文主要对混合模型的参数估计问题做了具体研究,运用不同的方法对混合正态模型以及混合Gamma模型的参数估计做了理论推导,并得到了较好的参数估计结论,为实际应用奠定了一定的基础。此外,该文的参考文献资料丰富,且符合论题的需要,选题也符合统计学的专业的要求,结构完整,思路清晰,格式规范观点表达准确,是一篇合格毕业论文。 指导教师(签名) 2021 6 2

新疆大学本科生毕业论文(设计)评议书学院:数学与系统科


学学院

论文(设计)题目: 混合模型的贝叶斯分析与选择

学生姓名: 蔡敏专业: 数学应用数学班级:应数11-1 指导教师姓名: 吴黎军职称:教授 评价内容具体要求得分

论文(设计)水平(30分)论文(设计)内容正确,撰写规范、有一定的创新 性和应用价值。 26

论文(设计报告25分)论文(设计)介绍思路清晰,表达简明扼要,重点

突出,能全面准确介绍论文(设计)内容,报告 间符合要求。 20

论文(设计)答辩(45分)回答问题正确,有理论依据,基本概念清楚,逻辑 性较强。 40

总分(100分)86 答辩委员会(小组)评语:

蔡敏同学的论文理论依据丰富,分析问题正确、全面,具有一定深度,并有所创见,对实际问题有一定的指导意义。


中心突出,论据较充足,结构严谨,层次分明,表达能力较强,材料丰富,能运用科学方法进行加工整理。 答辩委员会(小组)组长签名: 2021 6 2 论文(设计)综合成绩指导教师成绩 30%

答辩指导小组成绩 70% 综合成绩 五级分制 成绩




本文来源:https://www.wddqxz.cn/b2bd1a32ab114431b90d6c85ec3a87c240288a8b.html

相关推荐