BDA3の2.11 Exercisesの7を解く。 リンクはBayesian Data Analysis。
yは二項分布Bin(n,θ)に従う。よってPMFは
p(y∣θ)=(yn)θy(1−θ)n−y である。
指数型分布族は以下で表される。
p(y∣θ)=f(y)g(θ)eϕ(θ)Tu(y) ϕ(θ)は自然パラメーターである。 指数型分布族に含まれる分布は共役事前分布を持つ。事前分布を
p(θ)∝g(θ)ηeϕ(θ)Tν と構成すれば、事後分布は
p(θ∣y)∝g(θ)η+neϕ(θ)T(ν+t(y)) となり、共役となってる。
二項分布を指数型分布族の形で表すには
f(y)=(yn)g(θ)=(1−θ)nu(y)=yϕ(θ)=log(1−θθ) とする。従って、自然パラメーターϕはlog(1−θθ)である。
自然パラメーターϕの分布を一様分布にするためにはθはどのような分布になっていればよいか?
本文(2.19)式はθをϕにh(θ)で変換した時のp(θ)とp(ϕ)との関係式である。
p(ϕ)=p(θ)∣dϕdθ∣=p(θ)∣h′(θ)∣−1 ここで、
ϕ=h(θ)=log(1−θθ) である。ϕを一様分布にするので、
p(ϕ)∝1p(θ)∣h′(θ)∣−1∝1p(θ)∝∣h′(θ)∣ p(θ)∝∣h′(θ)∣で分布している時、ϕは一様分布となる。
h′(θ)=dθdlog(1−θθ)=θ(1−θ)1 従ってθの分布は
p(θ)∝θ−1(1−θ)−1 である。
事前分布p(θ)∝θ−1(1−θ)−1はBeta(α, β)のp(θ)∝θα−1(1−θ)β−1にα=β=0に入れたものと同等である。 実際にはBeta(0,0)は定義されないが、事後分布はp(θ∣y)∝θ−1+y(1−θ)−1+n−yとなる。
事後分布は
p(θ∣y)∝θ−1(1−θ)−1+n である。θ=0で値が無限大になり、積分値が1でなくなり、確率密度関数として不適切である。
事後分布は
p(θ∣y)∝θ−1+n(1−θ)−1 である。θ=1で値が無限大になり、積分値が1でなくなり、確率密度関数として不適切である。