当前位置: 首页 > article >正文

先验期望准则

内容来源

贝叶斯统计(第二版)中国统计出版社


先验期望准则

对给定的决策问题,若在状态集 Θ \Theta Θ 上有一个正常的先验分布 π ( θ ) \pi(\theta) π(θ)(不是广义先验分布

则收益函数 Q ( θ , α ) Q(\theta,\alpha) Q(θ,α) π ( θ ) \pi(\theta) π(θ) 的期望与方差称为

先验期望收益

Q ( a ) = E θ Q ( θ , a ) Q(a)=E^\theta Q(\theta,a) Q(a)=EθQ(θ,a)

收益的先验方差

V a r [ Q ( θ , a ) ] = E θ [ Q ( θ , a ) ] 2 − [ E θ Q ( θ , a ) ] 2 Var[Q(\theta,a)]=E^\theta[Q(\theta,a)]^2-[E^\theta Q(\theta,a)]^2 Var[Q(θ,a)]=Eθ[Q(θ,a)]2[EθQ(θ,a)]2

是先验期望收益达到最大的行动 a ′ a' a

Q ‾ ( a ′ ) = max ⁡ a ∈ A Q ( a ) \overline{Q}(a')=\max_{a\in A}Q(a) Q(a)=aAmaxQ(a)

称为先验期望准则下的最优行动

若此种最优行动不止一个,其中先验方差达到最小的行动称为二阶矩准则下的最优行动


http://www.kler.cn/a/547461.html

相关文章:

  • ORB-SLAM3的源码学习: Settings.cc:settings构造函数
  • 【吾爱出品】针对红警之类老游戏适用WIN10和11的补丁cnc-ddraw7.1汉化版
  • Beszel监控Docker安装
  • SQL Server STUFF 函数的用法及应用场景
  • Python学习心得字符串拼接的几种方法
  • R语言中的函数32:seq_along()
  • Centos安装php-8.0.24.tar
  • P9993 [Ynoi Easy Round 2024] TEST_133 Solution
  • Rust包管理
  • Vue学习笔记4
  • 循环队列知识点及习题
  • C++从入门到实战(四)C++引用与inline,nullptr
  • 青少年编程与数学 02-009 Django 5 Web 编程 13课题、URL分发
  • 【Java 面试 八股文】Spring Cloud 篇
  • 【认证授权FAQ】SSL/TLS证书过期导致的CLS认证失败
  • 联想笔记本电脑摄像头灯亮,但没有画面怎么解决,
  • Python的那些事第二十一篇:Python Web开发的“秘密武器”Flask
  • MATLAB图像处理:图像特征概念及提取方法HOG、SIFT
  • 将Sqlite3数据库挂在内存上处理
  • 老游戏回顾:GOWpsp