Juliaの世界

BDA3の2.11 Exercisesの20を解く。 本文はBayesian Data Analysis。 解答参考はSolutions to some exercises from Bayesian Data Analysis

  1. Censored and uncensored data in the exponential model

(a) y≥100を観測時の事後分布

y|θは指数分布Exponetial(θ)に従う。θの事前分布はガンマ分布Gamma(α,β)である。 y≥100を観測したとする。この時、θの事後分布θ|yはどうなるか? y|θの確率密度関数は

p(yθ)=θeθy p(y|θ)=θe^{-θy}

である。y≥100を観測したら

p(y100θ)=100θeθydθ p(y≥100|θ)=\int^{\infty}_{100}θe^{-θy}dθ

と尤度関数を計算できる。計算すると

p(y100θ)=θ[1θeθy]100=e100θ p(y≥100|θ)=θ[-\frac{1}{θ}e^{-θy}]^{\infty}_{100} =e^{-100θ}

となる。 θの確率密度関数は

p(θ)θα1eβθ p(θ)∝θ^{α-1}e^{-βθ}

であるので、事後分布θ|yの確率密度関数は

p(θy100)=e100yθα1eβθ=θα1e(β+100)θ p(θ|y≥100)=e^{-100y}θ^{α-1}e^{-βθ}=θ^{α-1}e^{-(β+100)θ}

である。つまり、θ|y≥100~Gamma(α,β+100)である。平均と分散は

E(θy100)=αβ+100 E(θ|y≥100)=\frac{α}{β+100} Var(θy100)=α(β+100)2 Var(θ|y≥100)=\frac{α}{(β+100)^2}

となる。

(b) y=100を観測時の事後分布

y=100の時の尤度関数は

p(y=100θ)=θe100θ p(y=100|θ)=θe^{-100θ}

となる。事後分布θ|yの確率密度関数は

p(θy=100)=θe100yθα1eβθ=θα+11e(β+100)θ p(θ|y=100)=θe^{-100y}θ^{α-1}e^{-βθ}=θ^{α+1-1}e^{-(β+100)θ}

となる。つまり、θ|y=100~Gamma(α+1,β+100)である。平均と分散は

E(θy=100)=α+1β+100 E(θ|y=100)=\frac{α+1}{β+100} Var(θy=100)=α+1(β+100)2 Var(θ|y=100)=\frac{α+1}{(β+100)^2}

となる。

(c) y≥100とy=100の時の分散の比較

Var(θy100)=α(β+100)2Var(θ|y≥100)=\frac{α}{(β+100)^2}Var(θy=100)=α+1(β+100)2Var(θ|y=100)=\frac{α+1}{(β+100)^2}となっており、 y=100を観測した時の方がθの事後分布の分散は大きくなっている。 y=100の方がyに関して情報が多いので、この結果は直感に反している。 この結果から言えることはyに関する厳密性はθの厳密性と無関係であるということである。