当前位置: 首页 > article >正文

一维/二维高斯分布的负对数似然推导

参考wikipedia Multivariate normal distribution 及 Normal distribution

基础公式

多元高斯分布公式
f ( X ) = f ( x 1 , x 2 , . . . , x k ) = 1 ( 2 π ) k ∣ ∑ ∣ e − 1 2 ( X − μ ) T ∑ − 1 ( X − μ ) f(X)=f(x_1,x_2,...,x_k)=\frac{1}{\sqrt{{(2\pi)}^k|\sum|}}e^{-\frac{1}{2}(X-\mu)^T\sum^{-1}(X-\mu)} f(X)=f(x1,x2,...,xk)=(2π)k 1e21(Xμ)T1(Xμ)
其中, μ = ( μ x 1 , μ x 2 , . . . , μ x k ) \mu=(\mu_{x_1},\mu_{x_2},...,\mu_{x_k}) μ=(μx1,μx2,...,μxk)
那么一维高斯分布公式
f ( x ) = 1 2 π σ 2 e − ( x − μ x ) 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu_x)^2}{2\sigma^2} } f(x)=2πσ2 1e2σ2(xμx)2
二维高斯分布公式
f ( x , y ) = 1 2 π ∣ ∑ ∣ e − 1 2 ( x − μ x y − μ y ) ∑ − 1 ( x − μ x y − μ y ) f(x,y)=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2} \begin{pmatrix}x-\mu_x &y-\mu_y\end{pmatrix}\sum^{-1}\begin{pmatrix}x-\mu_x \\ y-\mu_y\end{pmatrix}}\\ f(x,y)=2π 1e21(xμxyμy)1(xμxyμy)

为简化推导,后文将 d x = x − μ x d_x=x-\mu_x dx=xμx 记为x

一维高斯分布的负对数似然

N L L ( x , μ ∣ σ 2 ) = − l o g ( f ( x ) ) = − l o g ( 1 2 π σ 2 e − x 2 2 σ 2 ) = − ( − l o g ( 2 π σ 2 ) − x 2 2 σ 2 ) = l o g ( 2 π ) 2 + l o g ( σ ) + x 2 2 σ 2 NLL(x, \mu|\sigma^2)=-log(f(x))=-log(\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{x^2}{2\sigma^2} })\\ = -(-log(\sqrt{2\pi\sigma^2})-\frac{x^2}{2\sigma^2})\\ =\frac{log(2\pi)}{2}+log(\sigma)+\frac{x^2}{2\sigma^2} NLL(x,μσ2)=log(f(x))=log(2πσ2 1e2σ2x2)=(log(2πσ2 )2σ2x2)=2log(2π)+log(σ)+2σ2x2

二维高斯分布的负对数似然

二维高斯分布公式展开如下
f ( x , y ) = 1 2 π ∣ ∑ ∣ e − 1 2 ( x y ) ∑ − 1 ( x y ) = 1 2 π ∣ ∑ ∣ e − 1 2 x 2 σ y 2 − 2 ρ x y σ x σ y + y 2 σ x 2 d e t ( ∣ ∑ ∣ ) = 1 2 π ∣ ∑ ∣ e − 1 2 x 2 σ y 2 − 2 ρ x y σ x σ y + y 2 σ x 2 ( 1 − ρ 2 ) σ x 2 σ y 2 = 1 2 π σ x σ y 1 − ρ 2 e − 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) \begin{align}f(x,y)&=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2} \begin{pmatrix}x &y\end{pmatrix}\sum^{-1}\begin{pmatrix}x \\ y\end{pmatrix}}\\ &=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2}\frac{x^2\sigma_y^2-2\rho xy\sigma_x\sigma_y+y^2\sigma_x^2}{det(|\sum|)}}\\ &=\frac{1}{2\pi\sqrt{|\sum|}}e^{-\frac{1}{2}\frac{x^2\sigma_y^2-2\rho xy\sigma_x\sigma_y+y^2\sigma_x^2}{(1-\rho^2)\sigma_x^2\sigma_y^2}}\\ &=\frac{1}{2\pi\sigma_x\sigma_y\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2})} \end{align} f(x,y)=2π 1e21(xy)1(xy)=2π 1e21det()x2σy22ρxyσxσy+y2σx2=2π 1e21(1ρ2)σx2σy2x2σy22ρxyσxσy+y2σx2=2πσxσy1ρ2 1e2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2)
其中,
∑ = ( σ x 2 σ x y σ x y σ y 2 ) = ( σ x 2 ρ σ x σ y ρ σ x σ y σ y 2 ) \sum = \begin{pmatrix}{\sigma_x}^2 & \sigma_{xy}\\ \sigma_{xy} &{\sigma_y}^2 \end{pmatrix} = \begin{pmatrix}{\sigma_x}^2 & \rho\sigma_x\sigma_y\\ \rho\sigma_x\sigma_y &{\sigma_y}^2 \end{pmatrix} =(σx2σxyσxyσy2)=(σx2ρσxσyρσxσyσy2)
∑ − 1 = 1 ∣ ∑ ∣ ( σ y 2 − ρ σ x σ y − ρ σ x σ y σ x 2 ) {\sum}^{-1} = \frac{1}{|\sum|}\begin{pmatrix} \sigma_y^2 & -\rho\sigma_x\sigma_y\\ -\rho\sigma_x\sigma_y &\sigma_x^2\end{pmatrix} 1=1(σy2ρσxσyρσxσyσx2)
那么负对数似然为
− l o g ( f ( x , y ) ) = − l o g ( 1 2 π σ x σ y 1 − ρ 2 e − 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) ) = − ( − l o g ( 2 π σ x σ y ) − 1 2 l o g ( 1 − ρ 2 ) + ( − 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) ) ) = l o g ( 2 π σ x σ y ) + 1 2 l o g ( 1 − ρ 2 ) + 1 2 ( 1 − ρ 2 ) ( x 2 σ x 2 − 2 ρ x y σ x σ y + y 2 σ y 2 ) \begin{align}-log(f(x,y))&=-log(\frac{1}{2\pi\sigma_x\sigma_y\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2})})\\ &=-(-log(2\pi\sigma_x\sigma_y)-\frac{1}{2}log(1-\rho^2)+(-\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2})))\\ &=log(2\pi\sigma_x\sigma_y)+\frac{1}{2}log(1-\rho^2)+\frac{1}{2(1-\rho^2)}(\frac{x^2}{\sigma_x^2}-\frac{2\rho xy}{\sigma_x\sigma_y}+\frac{y^2}{\sigma_y^2}) \end{align} log(f(x,y))=log(2πσxσy1ρ2 1e2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2))=(log(2πσxσy)21log(1ρ2)+(2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2)))=log(2πσxσy)+21log(1ρ2)+2(1ρ2)1(σx2x2σxσy2ρxy+σy2y2)


http://www.kler.cn/a/283365.html

相关文章:

  • StructuredStreaming (一)
  • java八股-jvm入门-程序计数器,堆,元空间,虚拟机栈,本地方法栈,类加载器,双亲委派,类加载执行过程
  • 使用Docker快速部署FastAPI Web应用
  • 数据挖掘(九)
  • 【数据结构与算法】第11课—数据结构之选择排序和交换排序
  • 力扣515:在每个树行中找最大值
  • 【日常记录-Linux】.tar.xz、.tar.bz2、tar.gz解压
  • 8、嵌套循环 - 循环中的循环 - 课件
  • MySQL表分区与分表:概念、规则及应用案例
  • MyPrint打印设计器(四)vue3 函数式调用组件
  • vue3 使用vue-masonry加载更多,重新渲染
  • Java设计模式之装饰器模式详细讲解和案例示范
  • 深度学习:图像数据分析的革命
  • HTML静态网页成品作业(HTML+CSS)——电影肖申克的救赎介绍设计制作(1个页面)
  • jmeter连接mysql数据库以及常规用法
  • node环境安装、vue-cli搭建过程、element-UI搭建使用过程
  • 生产监控系统与生产控制系统区别
  • 【实践经验】端口被占用问题:listen tcp:bind:only one usage of each socket address
  • 文心智能体-梦想目标实现助手-实现你的老板梦
  • Golang小项目(1)
  • asp.net core在win上的发布和部署
  • 命令模式与事件驱动编程:如何将两者结合以优化系统设计
  • 卸载重装redis
  • Python新手:学习 itertools.takewhile 迭代右过滤
  • 如何使用 Go 语言开发微服务
  • MIT 6.5840(6.824) Lab 4:Fault-tolerant Key/Value Service 设计实现