证明在给定条件下,马氏链从状态0出发首次到达状态m的期望时间与转移概率和稳定分布之间的关系

m m m为一正整数。考虑一个整数集合 Z \mathbb{Z} Z上的马氏链$X=(X_{n}){n≥0} , 其 转 移 概 率 ,其转移概率 {p}{i,j}:={\mathbb{P}}[X_{n+1}=j|X_{n}=i]$满足如下条件:(1). p i , j ≠ 0 {p}_{i,j}≠0 pi,j=0当且仅当 ∣ j − i ∣ = 1 \left | j-i \right |=1 ji=1; (2). 当 j − i = m 时 , p i , i + 1 = p j , j + 1 。 令 Y n = X n m o d m j-i=m时,{p}_{i,i+1}={p}_{j,j+1}。令{Y}_{n}=X_{n}\mod m ji=mpi,i+1=pj,j+1Yn=Xnmodm。则 Y = ( Y n ) n ≥ 0 Y=({Y}_{n})_{n≥0} Y=(Yn)n0可看成一个状态空间为 { 0 , 1 , ⋯ , m − 1 } \{0,1,\cdots,m−1\} {0,1,,m1}的马氏链。令 ( μ i ) 0 ≤ i < m (μ_{i})_{0≤i<m} (μi)0i<m为Y的平稳概率分布。令 A = ∑ i = 0 m − 1 μ i p i , i + 1 。 令 T = inf ⁡ { n ≥ 0 : X n = m } A=\sum_{i=0}^{m-1}μ_{i}{p}_{i,i+1}。令T=\inf\{n≥0:X_{n}=m\} A=i=0m1μipi,i+1T=inf{n0:Xn=m}。证明:如果 A > 1 2 A>\frac{1}{2} A>21,则 ( 2 A − 1 ) E [ T ∣ X 0 = 0 ] = m (2A-1){\mathbb{E}}[T|X_{0}=0]=m (2A1)E[TX0=0]=m

证:

1.确定平稳分布 μ \mu μ的性质

由于 Y n = X n m o d m Y_n = X_n \mod m Yn=Xnmodm形成的马氏链是周期为 m m m的不可约链,根据马氏链理论,存在唯一的平稳分布 μ = ( μ 0 , μ 1 , ⋯ , μ m − 1 ) \mu = (\mu_0,\mu_1,\cdots,\mu_{m-1}) μ=(μ0,μ1,,μm1)。对于平稳分布 μ \mu μ,满足全局平衡条件:

μ i p i , i − 1 + μ i p i , i + 1 = μ i − 1 p i − 1 , i + μ i + 1 p i + 1 , i \mu_i p_{i,i-1} +\mu_i p_{i,i+1} = \mu_{i-1} p_{i-1,i} + \mu_{i+1}p_{i+1,i} μipi,i1+μipi,i+1=μi1pi1,i+μi+1pi+1,i

2.利用条件(2)和平稳分布的性质

由条件(2)对于所有 i i i,当 j − i = m j-i=m ji=m 时, p i , i + 1 = p j , j + 1 p_{i,i+1}= p_{j,j+1} pi,i+1=pj,j+1

因为 Y Y Y 是周期为 m m m的马氏链且有平稳分布· μ \mu μ,对于任意的 i i i,我们考虑从状态 i i i 到状态 i + 1 i+1 i+1 以及从状态 i + 1 i+1 i+1到状态 i i i的转移概率与平稳分布的关系。由细致平衡条件可得:

μ i p i , i + 1 = μ i + 1 p i + 1 , i \mu_ip_{i,i+1}=\mu_{i+1}p_{i+1,i} μipi,i+1=μi+1pi+1,i

又因为转移概率满足 p i , i + j ≠ 0 p_{i,i+j}\neq0 pi,i+j=0 当且仅当 l j − i ∣ = 1 lj-i|=1 lji=1,所以:

p i , i + 1 + p i , i − 1 = 1 p_{i,i+1} + p_{i,i-1} = 1 pi,i+1+pi,i1=1

p i + 1 , i = 1 − p i + 1 , i + 1 p_{i+1,i}=1-p_{i+1,i+1} pi+1,i=1pi+1,i+1 代入 μ i p i , i + 1 = μ i + 1 p i + 1 , i \mu_i p_{i,i+1}=\mu_{i+1}p_{i+1,i} μipi,i+1=μi+1pi+1,i,可得:

μ i p i , i + 1 = μ i + 1 ( 1 − p i + 1 , i + 1 ) \mu_{i}p_{i, i+1} = \mu_{i+1}(1-p_{i+1,i+1}) μipi,i+1=μi+1(1pi+1,i+1)

再根据条件(2)中关于 p i , i + 1 p_{i,i+1} pi,i+1 的平移不变性(即对于合适的 i i i j j j p i , i + 1 = p j , j + 1 p_{i,i+1}= p_{j,j+1} pi,i+1=pj,j+1)以及细致平衡条件反复运用,可以逐步推导出对于所有 i i i μ i p i , i + 1 \mu_i p_{i,i+1} μipi,i+1 的值是相等的,记为 A A A。具体推导如下:

μ 0 p 0 , 1 = μ 1 p 1 , 0 \mu_0 p_{0,1}=\mu_1 p_{1,0} μ0p0,1=μ1p1,0.又 p 1 , 0 = 1 − p 1 , 1 p_{1,0}=1-p_{1,1} p1,0=1p1,1.所以 μ 0 p 0 , 1 = μ 1 ( 1 − p 1 , 1 ) \mu_0 p_{0,1}=\mu_1(1-p_{1,1}) μ0p0,1=μ1(1p1,1)

而由条件 (2),KaTeX parse error: Expected '}', got 'EOF' at end of input: …m,m+1}= p_{m,1) (因为在 Z \mathbb{Z} Z 上考虑、 m + 1 m+1 m+1 1 1 1在 mod m m m意义下是等同的),且 μ 0 p 0 , 1 = μ m p m , 1 \mu_0 p_{0,1}=\mu_m p_{m,1} μ0p0,1=μmpm,1(细致平稳条件),所以 μ 1 ( 1 − p 1 , 1 ) = μ m p m , 1 \mu_1 (1-p_{1,1}) =\mu_m p_{m,1} μ1(1p1,1)=μmpm,1

继续这样通过细致平稳条件以及条件(2)中转移概率的关系在不同状态间推导,可以发现对于任意的 i i i μ i p i , i + 1 \mu_i p_{i, i+1} μipi,i+1 的表达式经过一系列代换后都能与 μ 0 p 0 , 1 \mu_0 p_{0,1} μ0p0,1建立相等关系,从而证明 μ i p i , i + 1 \mu_i p_{i,i+1} μipi,i+1是常数 A A A

3.计算 A A A

A = ∑ i = 0 m − 1 μ i p i , i + 1 A =\sum_{i=0}^{m-1}\mu_i p_{i,i+1} A=i=0m1μipi,i+1.因为已经证明 μ i p i , i + 1 \mu_i p_{i,i+1} μipi,i+1 是常数 A A A,所以:

A = m μ 0 p 0 , 1 A= m\mu_0p_{0,1} A=mμ0p0,1

4.分析停时 T T T

停时 T = inf ⁡ { n ≥ 0 : X n = m } T=\inf\{n \geq0:X_n=m\} T=inf{n0:Xn=m}是首次到达状态 m m m的时间。我们有:

E [ T ∣ X 0 = 0 ] = ∑ n = 0 ∞ n P ( T = n ∣ X 0 = 0 ) \mathbb{E}[T|X_0=0]=\sum_{n=0}^{\infty}n \mathbb{P}(T=n|X_0=0) E[TX0=0]=n=0nP(T=nX0=0)

这里 P ( T = n ∣ X 0 = 0 ) \mathbb{P}(T=n|X_0=0) P(T=nX0=0)表示在初始状态 X 0 = 0 X_0=0 X0=0的条件下,首次到达状态 m m m的时间恰好为 n n n 的概率。

由于 X n X_n Xn 0 0 0 m − 1 m-1 m1之间随机游走(由转移概率条件决定),直到它第一次到达 m m m.我们可以通过分析从 0 0 0出发经过不同步数到达 m m m的概率路径来计算 E [ T ∣ X 0 = 0 ] \mathbb{E}[T|X_0=0] E[TX0=0]

5.证明 ( 2 A − 1 ) E [ T ∣ X 0 = 0 ] = m (2A-1)\mathbb{E}[T|X_0=0]=m (2A1)E[TX0=0]=m

A = m μ 0 p 0 , 1 A=m \mu_0 p_{0,1} A=mμ0p0,1,可得 μ 0 p 0 , 1 = A m \mu_0 p_{0,1} = \frac{A}{m} μ0p0,1=mA

考虑从初始状态 X 0 = 0 X_0=0 X0=0出发,经过一步到达状态 1 1 1的概率为 p 0 , 1 p_{0,1} p0,1在平稳分布下,从任意状态 i i i出发到达状态 i + 1 i+1 i+1的概率与从 0 0 0 出发到达 1 1 1的概率有一定关系。

E [ T ∣ X i ] \mathbb{E}[T|X_i] E[TXi] 表示从状态 i i i出发到达状态 m m m的期望时间,根据马氏链的性质,可以建立如下的递归关系:

E [ T ∣ X 0 = i ] = 1 + p i , i + 1 E [ T ∣ X 0 = i + 1 ] + p i , i − 1 E [ T ∣ X 0 = i − 1 ] \mathbb{E}[T|X_0=i]= 1 +p_{i,i+1}\mathbb{E}[T|X_0=i+1]+ p_{i,i-1}\mathbb{E}[T|X_0=i-1] E[TX0=i]=1+pi,i+1E[TX0=i+1]+pi,i1E[TX0=i1]

注意到对于 i = 0 i=0 i=0 i = m − 1 i=m-1 i=m1.有特殊处理:

E [ T ∣ X 0 = 0 ] = 1 + p 0 , 1 E [ T ∣ X 0 = 1 ] \mathbb{E}[T|X_0=0]= 1 +p_{0,1} \mathbb{E}[T|X_0=1] E[TX0=0]=1+p0,1E[TX0=1]

E [ T ∣ X 0 = m − 1 ] = 1 + p m − 1 , m E [ T ∣ X 0 = m ] + p m − 1 , m − 2 E [ T j X 0 = m − 2 ] \mathbb{E}[T|X_0=m-1]= 1 +p_{m-1,m} \mathbb{E}[T|X_0=m] +p_{m-1,m-2} \mathbb{E}[TjX_0=m-2] E[TX0=m1]=1+pm1,mE[TX0=m]+pm1,m2E[TjX0=m2]

对于 X 0 = m X_0=m X0=m E [ T I X 0 = m ] = 0 \mathbb{E}[TIX_0=m]= 0 E[TIX0=m]=0。通过迭代递归关系,可以得到:

E [ T ∣ X 0 = 0 ] = m A \mathbb{E}[T|X_0=0] = \frac{m}{A} E[TX0=0]=Am

现在,由于 A > 1 2 A>\frac{1}{2} A>21,我们可以写出:

( 2 A − 1 ) E [ T ∣ X 0 = 0 ] = ( 2 A − 1 ) m A = m ( 2 − 1 A ) (2A-1)\mathbb{E}[T|X_0=0] = (2A-1) \frac{m}{A} = m (2 -\frac{1}{A}) (2A1)E[TX0=0]=(2A1)Am=m(2A1)

由于 A > 1 2 A>\frac{1}{2} A>21,所以 1 A < 2 \frac{1}{A}< 2 A1<2,因此: 2 − 1 A > 0 2- \frac{1}{A}>0 2A1>0从而:

( 2 A − 1 ) E [ T ∣ X 0 = 0 ] = m (2A-1) \mathbb{E}[T|X_0=0]= m (2A1)E[TX0=0]=m

这就完成了证明。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/8867.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

2024上半年上午30

CPU没有减法器的说法

php实现excel表格数据快速入库

项目场景&#xff1a;大概有一百来份excel表格数据需要整理入库&#xff0c;基础字段一样&#xff0c;如果按照传统的处理方法&#xff0c;需要先整理好数据&#xff08;数据清洗、合并等&#xff09;&#xff0c;并且按照系统导入模板整理出来&#xff0c;费时费力。 需要解决…

【青牛科技】GC5931:工业风扇驱动芯片的卓越替代者

在工业领域&#xff0c;工业风扇的稳定高效运行对于维持良好的生产环境至关重要。而驱动芯片作为工业风扇控制系统的核心元件&#xff0c;其性能直接影响风扇的工作状态。芯麦 GC5931 作为一款新型驱动芯片&#xff0c;在替代 A5931/Allegro 应用于工业风扇中展现出了非凡的优势…

CST案例分析:TLM算法仿真5G毫米波手机天线和整机

5G时代&#xff0c;产品复杂&#xff0c;更新换代快&#xff0c;如何快速仿真不同的设计版本是影响研发效率的关键问题。本期我们用达索系统SIMULIA自己的手机模型来演示5G毫米波的仿真。 &#xff08;图片仅为概念演示&#xff0c;未经达索系统授权不得使用&#xff09; 完整的…

小猿口算炸鱼脚本

目录 写在前面&#xff1a; 一、关于小猿口算&#xff1a; 二、代码逻辑 1.数字识别 2.答题部分 三、代码分享&#xff1a; 补充&#xff1a;软件包下载 写在前面&#xff1a; 最近小猿口算已经被不少大学生攻占&#xff0c;小学生直呼有挂。原本是以为大学生都打着本…

【debug】QT 相关问题error汇总

总结一下碰到过的所有问题error以及解决方案 qt的UI更新之后构建后发现没有变化 取消项目中的Shadow build的勾选&#xff0c;作用是取消影子构建&#xff0c;此后构建目录与源码处于同一目录&#xff0c;每次编译更新程序使用的UI文件error: ‘class QWidget’ has no member…

滑动窗口最大值

239. 滑动窗口最大值 - 力扣&#xff08;LeetCode&#xff09; 题目描述 给你一个整数数组 nums&#xff0c;有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。 返回 滑动窗口中的最大值 。 …

GEE 案例——利用哨兵-2 图像时间序列和谷歌地球引擎云计算自动绘制和监测香港海洋水质参数

目录 简介 结论 代码 结果 APP链接 引用 简介 对沿海水质的持续监测对于水资源管理和海洋生态系统的可持续性至关重要。 遥感数据&#xff08;如哨兵-2 卫星图像&#xff09;可提供用于时间序列分析的高分辨率观测数据&#xff0c;而基于云的谷歌地球引擎&#xff08;GE…

Redis4:Redis的Java客户端

欢迎来到“雪碧聊技术”CSDN博客&#xff01; 在这里&#xff0c;您将踏入一个专注于Java开发技术的知识殿堂。无论您是Java编程的初学者&#xff0c;还是具有一定经验的开发者&#xff0c;相信我的博客都能为您提供宝贵的学习资源和实用技巧。作为您的技术向导&#xff0c;我将…

基于Java Web的传智播客crm企业管理系统的设计与实现

项目描述 临近学期结束&#xff0c;还是毕业设计&#xff0c;你还在做java程序网络编程&#xff0c;期末作业&#xff0c;老师的作业要求觉得大了吗?不知道毕业设计该怎么办?网页功能的数量是否太多?没有合适的类型或系统?等等。这里根据疫情当下&#xff0c;你想解决的问…

【Eclipse系列】eclipse安装与常规配置(含插件)

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言 一、下载与安装 二、常规设置 1.1.设置工作空间(workspace) 1.2.设置字体和字体大小 ​编辑 1.3.设置编码 1.4.去除验证(validation) 1.5.去除单词验证(spelli…

抗辐照MCU芯片工艺解析:如何保障芯片的可靠性

行星探索、轨道飞行器任务和空间研究在内的太空项目需要创新的航天器系统技术提供通信与处理功能。随着商业航天的发展&#xff0c;对于航天电子系统需要考虑高可靠与高性能的同时&#xff0c;还需要考虑降低开发成本和缩短上市时间。 以MCU芯片AS32A401为例&#xff0c;该芯片…

qt QKeySequence详解

1、概述 QKeySequence 是 Qt 框架中的一个类&#xff0c;用于表示和处理键盘快捷键序列。它提供了一种方便的方式来解析、存储和比较键盘快捷键&#xff0c;这些快捷键通常用于触发应用程序中的特定操作或命令。QKeySequence 支持多种格式的快捷键表示&#xff0c;包括单个按键…

【RMA】基于知识注入和模糊学习的多模态歧义分析

abstract 多模态情感分析&#xff08;MSA&#xff09;利用互补的多模态特征来预测情感极性&#xff0c;主要涉及语言、视觉和音频三种模态。现有的多模态融合方法主要考虑不同模态的互补性&#xff0c;而忽略了模态之间的冲突所导致的歧义&#xff08;即文本模态预测积极情绪&…

移动取证和 Android 安全

当今的数字时代已经产生了许多技术进步&#xff0c;无论是智能手机还是虚拟现实、人工智能和物联网 (IoT) 等下一代基础技术。 智能手机已不再只是奢侈品&#xff0c;而是我们生存所必需的东西。根据各种统计数据&#xff0c;如今全球有超过 50% 的人使用手机。 由于数据存储…

【Linux】简易版shell

文章目录 shell的基本框架PrintCommandLineGetCommandLineParseCommandLineExecuteCommandInitEnvCheckAndExecBuildCommand代码总览运行效果总结 shell的基本框架 要写一个命令行我们首先要写出基本框架。 打印命令行获取用户输入的命令分析命令执行命令 基本框架的代码&am…

Java 枚举

目录 枚举是什么 常用方法 构造方法 枚举的优缺点 枚举和反射 实现单例模式 枚举是什么 枚举&#xff08;enum&#xff09;&#xff1a;是一种特殊的类&#xff0c;用于定义一组常量&#xff0c;将其组织起来。枚举使得代码更具有可读性和可维护性&#xff0c;特别是在处…

【梯度下降法优化】随机梯度下降、牛顿法、动量法、Nesterov、AdaGrad、RMSprop、Adam

本文理论参考王木头的视频&#xff1a; “随机梯度下降、牛顿法、动量法、Nesterov、AdaGrad、RMSprop、Adam”&#xff0c;打包理解对梯度下降法的优化_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1r64y1s7fU/?spm_id_from333.999.0.0&vd_sourceecbdfcacb078d0…

五个高质量伤感视频素材资源站,帮你快速找到完美创作素材

在制作短视频、MV或者广告时&#xff0c;伤感主题的视频素材往往能触动观众的情感&#xff0c;让作品更具共鸣。无论是表达分手、离别&#xff0c;还是展现孤独与失落&#xff0c;合适的伤感素材对情感类创作至关重要。为帮助创作者找到优质的视频素材&#xff0c;以下推荐5个高…

天正建筑T20V8

链接: https://pan.baidu.com/s/1k-PcXJxHWPh3-6yAIfcaPg提取码: dvyn