详解高斯混合模型与EM算法

12 篇文章 3 订阅
订阅专栏

详解高斯混合模型与EM算法

高斯混合模型

单高斯模型(Gaussian single model, GSM)

一维高斯分布

高斯模型是一种常用的变量分布模型,一维高斯分布的概率密度函数如下:
在这里插入图片描述
在这里插入图片描述

多维高斯分布

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

混合高斯模型(Gaussian mixture model, GMM)

混合高斯模型产生的原因

先来看一组数据。
在这里插入图片描述
如果我们假设这组数据是由某个高斯分布产生的,利用极大似然估计(后文还会提及)对这个高斯分布做参数估计,得到一个最佳的高斯分布模型如下。
在这里插入图片描述
一般来讲越靠近椭圆的中心样本出现的概率越大,这是由概率密度函数决定的,但是这个高斯分布的椭圆中心的样本量却极少。显然样本服从单高斯分布的假设并不合理。单高斯模型无法产生这样的样本。

实际上,这是用两个不同的高斯分布模型产生的数据
在这里插入图片描述
它通过求解两个高斯模型,并通过一定的权重将两个高斯模型融合成一个模型,即最终的混合高斯模型。这个混合高斯模型可以产生这样的样本。

更一般化的描述为:假设混合高斯模型由K个高斯模型组成(即数据包含K个类),则GMM的概率密度函数如下:
在这里插入图片描述
在这里插入图片描述高斯混合模型本质
是融合几个单高斯模型,来使得模型更加复杂,从而产生更复杂的样本。理论上,如果某个混合高斯模型融合的高斯模型个数足够多,它们之间的权重设定得足够合理,这个混合模型可以拟合任意分布的样本。

直观理解高斯混合模型
一维混合高斯模型

在这里插入图片描述
在这里插入图片描述

二维空间3个高斯模型混合

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

极大似然估计(Maximum Likehood Estimate, MLE)(最大化对数似然函数)

首先直观化地解释一下最大化对数似然函数要解决的是什么问题。
在这里插入图片描述
在这里插入图片描述
那怎么找到这个合适的高斯分布呢(在图8中的表示就是1~4哪个分布较为合适)?这时候似然函数就闪亮登场了。
在这里插入图片描述
 所以最大化似然函数的意义就是:通过使得样本集的联合概率最大来对参数进行估计,从而选择最佳的分布模型。
 对于图8产生的样本用最大化似然函数的方法,最终可以得到序号1对应的高斯分布模型是最佳的模型。

EM算法(最大化Q函数)

EM算法与极大似然估计分别适用于什么问题

尝试用极大似然估计的方法来解GMM模型

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

极大似然估计与EM算法适用问题分析

在这里插入图片描述
在这里插入图片描述
总结:
 如果我们已经清楚了某个变量服从的高斯分布,而且通过采样得到了这个变量的样本数据,想求高斯分布的参数,这时候极大似然估计可以胜任这个任务;而如果我们要求解的是一个混合模型,只知道混合模型中各个类的分布模型(譬如都是高斯分布)和对应的采样数据,而不知道这些采样数据分别来源于哪一类(隐变量),那这时候就可以借鉴EM算法。EM算法可以用于解决数据缺失的参数估计问题(隐变量的存在实际上就是数据缺失问题,缺失了各个样本来源于哪一类的记录)。

EM算法

EM算法(Expectation-Maximization algorithm)分两步,第一步先求出要估计参数的粗略值,第二步使用第一步的值最大化似然函数。因此要先求出GMM的似然函数。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

算法步骤
第一步

在这里插入图片描述

第二步 E-step

在这里插入图片描述

第三步 M-step

在这里插入图片描述

第四步

在这里插入图片描述

第五步

检查参数是否收敛或对数似然函数是否收敛,若不收敛,则返回第2步。

一个例子梳理EM算法的整个过程

在这里插入图片描述
在这里插入图片描述

总结

在这里插入图片描述
在这里插入图片描述

混合模型(GMM)和EM算法详解
01-20
小白一枚,接触到GMM和EM,现将学习到的整理出来,如有错误,欢迎指正,文中涉及到公式的推导比较...(以上两条是基础,为了下面做铺垫,接下来我将通过例子引出混合模型。) 3.混合模型(GMM) 为什么会有
混合模型(GMM)及EM算法---MATLAB程序
zd1_666的博客
05-06 4521
混合模型(Gaussian Mixed Model,GMM)是由多个斯分布函数组成的线性组合。理论上,GMM可以拟合出任意类型的分布,通常用于解决同一集合下的数据包含多个不同分布的情况。
混合模型(GMM)与期望最大化算法EM
生活就像海洋
06-25 5046
详细解读了EM算法原理以及GMM的优化过程。
斯坦福大学机器学习——EM算法求解混合模型
linkin1005的专栏
11-17 3万+
EM算法(Expection-Maximizationalgorithm,EM)是一种迭代算法,通过E步和M步两大迭代步骤,每次迭代都使极大似然函数增加。但是,由于初始值的不同,可能会使似然函数陷入局部最优。下面来谈谈EM算法以及其在求解混合模型中的作用。
混合模型(GMM)及其EM算法的理解
热门推荐
小平子的专栏
03-02 31万+
一个例子混合模型(Gaussian Mixed Model)指的是多个斯分布函数的线性组合,理论上GMM可以拟合出任意类型的分布,通常用于解决同一集合下的数据包含多个不同的分布的情况(或者是同一类分布但参数不一样,或者是不同类型的分布,比如正态分布和伯努利分布)。如图1,图中的点在我们看来明显分成两个聚类。这两个聚类中的点分别通过两个不同的正态分布随机生成而来。但是如果没有GMM,那么只能用一
模型原理.zip一文详解混合模型原理
09-24
模型
数据结构与算法概念和例题详解
最新发布
03-30
数据结构与算法概念和例题详解
数据结构与算法代码详解JAVA版
08-26
详解了一些经典算法和数据结构,希望对大家有帮助,鄙人能力有限,代码出错的地方请大家多多指正
机器学习中的EM算法详解及R语言实例
12-27
机器学习算法实例代码,机器学习中的EM算法详解及R语言实例,K均值算法非常简单(可参见之前发布的博文),详细读者都可以轻松地理解它。但下面将要介绍的EM算法就要困难许多了,它与极大似然估计密切相关
机器学习算法(二十九):混合模型(Gaussian Mixed Model,GMM)
weixin_39910711的博客
04-05 2万+
目录 1 混合模型(Mixture Model) 2 模型 2.1 单模型 2.2混合模型 3模型参数学习 3.1单模型 3.2混合模型 4混合模型与K均值算法对比 1 混合模型(Mixture Model) 混合模型是一个可以用来表示在总体分布(distribution)中含有 K 个子分布的概率模型,换句话说,混合模型表示了观测数据在总体中的概率分布,它是一个由 K 个子分布组成的混合分布。混合模型不要求观测数据提供关于子分布的...
EM算法混合模型原理详解及小例子
m0_46385527的博客
10-16 3150
EM算法混合模型 EM算法经常用在混合模型下,那么首先我们先介绍一下什么是混合模型 什么是混合模型 首先我们对于单个模型我们会有如下数据,并且不同的数据服从的斯也不同,也就是它们的参数θ{μ,ε}\theta\{\mu,\varepsilon\}θ{μ,ε}不同 并且我们可以通过极大似然估计的方法求偏导等于0的方法也可以很快的求出最优的参数解 我们对μ\muμ求偏导 μMLE=1N∑i=1Nxi \mu_{MLE}=\frac 1{N}\sum_{i=1}^Nx_i μMLE​
斯分布、混合模型EM算法详细介绍及其原理详解
IronmanJay的博客
03-06 3521
今天给大家带来的主要内容包括:斯分布,混合模型EM算法。废话不多说,下面就是本文的全部内容了!
机器学习笔记之混合模型(三)EM算法求解混合模型(E步操作)
静静的学习就好
09-09 1035
上一节介绍了尝试使用极大似然估计求解混合模型模型参数,但无法求出解析解。本节将介绍使用EM算法求解混合模型模型参数。
机器学习之EM算法原理及混合模型
L
05-10 571
EM
详解EM算法混合模型(Gaussian mixture model, GMM)
林立民爱洗澡
07-14 14万+
  最近在看晓川老(shi)师(shu)的博士论文,接触了混合模型(Gaussian mixture model, GMM)和EM(Expectation Maximization)算法,不禁被论文中庞大的数学公式所吓退。本文通过查阅相关资料,在复杂巧妙的推理公式中融入了自己的理解,详细梳理了混合模型EM算法。 1 单模型(Gaussian single model, GSM)...
EM算法--二维混合模型(GMMs)
触动人生的博客
03-30 3897
参考文章 http://blog.163.com/baolong_zhu/blog/static/196311091201421185531966/ 《统计学习方法》 李航 EM算法是一种迭代算法,1977年由Dempster等人总结出,用于含有隐变量的概率模型参数的极大似然估计,或极大后验概率估计。EM算法的每次迭代由两步组成:E步,求期望(expectation);M步...
混合模型EM算法
nth2000的博客
10-30 949
K均值聚类算法的回顾 算法流程 初始化:随机选择K个中心点μ0,μ1⋯μk\mu_0,\mu_1 \cdots \mu_kμ0​,μ1​⋯μk​ 迭代进行如下步骤: 分类:每一个实例点jjj被分类到与他距离最近的中心处。若设第t次迭代界数后的分类函数为C(t)(j)C^{(t)}(j)C(t)(j)将实例点xjx_jxj​分类,则应该满足C(t)(j)=argmini∣∣ui−xj∣∣2C^{(t)}(j) = argmin_i ||u_i - x_j||^2C(t)(j)=argmini​∣∣ui​−
(《机器学习》完整版系列)第9章 聚类——9.4 混合模型EM算法详细推导
qiy_icbc的博客
03-02 544
上篇博我们给出了混合模型EM算法,这里我们对它的公式进行详细推导.
详解EM算法混合
07-27
EM算法是一种用于估计带有隐变量的概率模型参数的迭代优化算法。它被广泛应用于处理包含未观测变量的统计问题,其中最常见的应用之一是混合模型的参数估计。 混合模型是一种常用的概率模型,它由多个斯分布组成,每个斯分布对应一个潜在的类别或成分。混合模型可以用于对复杂数据进行建模,其中每个样本点可能属于不同的成分。 EM算法混合模型中的应用是通过迭代地估计模型参数来实现的。具体而言,EM算法包括两个步骤:E步和M步。 在E步中,根据当前的模型参数,计算每个样本点属于每个成分的后验概率。这可以通过使用贝叶斯公式来实现。后验概率表示了每个样本点属于每个成分的可能性。 在M步中,利用E步中计算得到的后验概率,更新模型参数。这可以通过最大化完全数据的对数似然函数来实现。具体而言,更新每个斯成分的均值、方差和权重。 通过反复迭代E步和M步,EM算法逐渐优化模型参数,使得模型对观测数据的拟合度不断提。当算法达到收敛条件时,即参数不再变化或变化足够小,算法停止并输出最终的参数估计结果。 总结起来,EM算法通过迭代优化的方式,估计混合模型中的参数。它通过E步计算后验概率,M步更新参数,不断优化模型的拟合度。这使得EM算法成为了估计带有隐变量的概率模型参数的一种常用方法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 详解 sklearn 中 TSNE可视化 23638
  • 计算机视觉-----图像分类综述 23219
  • 详解自动编码器(AE) 19515
  • 详解python主函数 17693
  • 衡量两个概率分布之间的差异性的指标 16938

分类专栏

  • 技术积累 7篇
  • 金融数据相关 4篇
  • Tensorflow实战
  • 金融相关知识 5篇
  • 穷查理宝典(读书笔记) 2篇
  • 区块链知识分享
  • 探讨找工作的知识点
  • 计算机视觉(CV算法学习) 3篇
  • 算法岗面试笔试准备 32篇
  • Python基础与进阶 7篇
  • Java基础与进阶 7篇
  • 银行技术岗准备 6篇
  • 剑指offer(Python实现) 1篇
  • 程序员代码面试指南(Python实现) 13篇
  • 数据结构(LeetCode Python实现) 9篇
  • 笔试算法题(LeetCode Python实现) 3篇
  • 重点算法(Python实现) 2篇
  • Avery的笔试题复习总结 10篇
  • 数据结构与算法(网课笔记)
  • Hive(网课笔记) 4篇
  • spark:从入门到实战(网课笔记) 3篇
  • 菜菜的机器学习sklearn实战(网课笔记) 4篇
  • 利用Python进行数据分析(读书笔记) 6篇
  • Python数据分析与挖掘实战(读书笔记) 5篇
  • 算法导论(读书笔记) 1篇
  • MySQL必知必会(读书笔记) 9篇
  • 深度学习框架(读书笔记) 3篇
  • 程序员的数学(读书笔记) 2篇
  • 统计学习方法(读书笔记) 2篇
  • 神经网络与深度学习(读书笔记) 10篇
  • 机器学习-周志华(读书笔记) 13篇
  • 机器学习 12篇
  • 研究方向相关 3篇
  • 补充知识 5篇
  • 计算广告(读书笔记) 1篇

最新评论

  • 数据结构(Python实现)------N叉树

    王小二1号: 你的代码有少许问题,不过非常感谢,很有用

  • 详解ChaosBlade

    zccao_gong: 请问老师这流程是直接做一遍实验吗!

  • 菜菜的机器学习sklearn实战-----集成学习----随机森林

    十六poi: 有没有视频课呢表情包

  • 数据结构(Python实现)------ 哈希表

    海绵大宝贝: 你为何如此优秀

  • 第四章 前馈神经网络

    m0_73590678: 请问一下,这是哪本书里的内容呀

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • 云架构师学习------腾讯云通识-网络与安全
  • 云架构师学习------腾讯云通识-存储与数据库
  • 云架构师学习------云存储白皮书深入理解
2024年1篇
2023年5篇
2022年1篇
2021年5篇
2020年150篇
2019年44篇

目录

目录

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳SEO优化公司青岛网站推广哪家好德宏网站搭建哪家好济源百度seo多少钱坪地网站推广系统报价焦作百度标王报价拉萨seo排名景德镇模板制作公司辽源阿里店铺运营多少钱百色如何制作网站多少钱清徐关键词排名公司濮阳网站定制报价辽源网站改版价格河池如何制作网站报价孝感网站设计公司大浪网站开发公司白城网站排名优化安康seo排名多少钱宁德营销型网站建设推荐南宁英文网站建设报价衡阳外贸网站建设公司大芬网站优化软件哪家好嘉兴模板网站建设推荐海南优秀网站设计公司乐山外贸网站设计多少钱大同网站定制推荐桐城百度标王报价眉山网站搜索优化报价陇南网络推广价格汉中网站优化中山网站优化按天收费推荐歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化