BDA3の2.11 Exercisesの20を解く。 本文はBayesian Data Analysis。 解答参考はSolutions to some exercises from Bayesian Data Analysis。
y|θは指数分布Exponetial(θ)に従う。θの事前分布はガンマ分布Gamma(α,β)である。 y≥100を観測したとする。この時、θの事後分布θ|yはどうなるか? y|θの確率密度関数は
p(y∣θ)=θe−θy である。y≥100を観測したら
p(y≥100∣θ)=∫100∞θe−θydθ と尤度関数を計算できる。計算すると
p(y≥100∣θ)=θ[−θ1e−θy]100∞=e−100θ となる。 θの確率密度関数は
p(θ)∝θα−1e−βθ であるので、事後分布θ|yの確率密度関数は
p(θ∣y≥100)=e−100yθα−1e−βθ=θα−1e−(β+100)θ である。つまり、θ|y≥100~Gamma(α,β+100)である。平均と分散は
E(θ∣y≥100)=β+100α Var(θ∣y≥100)=(β+100)2α となる。
y=100の時の尤度関数は
p(y=100∣θ)=θe−100θ となる。事後分布θ|yの確率密度関数は
p(θ∣y=100)=θe−100yθα−1e−βθ=θα+1−1e−(β+100)θ となる。つまり、θ|y=100~Gamma(α+1,β+100)である。平均と分散は
E(θ∣y=100)=β+100α+1 Var(θ∣y=100)=(β+100)2α+1 となる。
Var(θ∣y≥100)=(β+100)2αとVar(θ∣y=100)=(β+100)2α+1となっており、 y=100を観測した時の方がθの事後分布の分散は大きくなっている。 y=100の方がyに関して情報が多いので、この結果は直感に反している。 この結果から言えることはyに関する厳密性はθの厳密性と無関係であるということである。