BDA3の2.11 Exercisesの5を解く。 リンクはBayesian Data Analysis。
コインをn回振る。yは表が出た回数。表が出る確率はθ。
yの事前予測分布Pr(y=k)を計算せよ。
θは一様分布Uniform(0,1)に従うとする。yの事前予測分布は
Pr(y=k)=∫01Pr(y=k∣θ)Pr(θ)dθ で計算できる。Pr(θ)=1なので
Pr(y=k)=∫01Pr(y=k∣θ)dθ yは二項分布Binomial(n,θ)に従うので、そのPDFは
Pr(y=k∣θ)=(kn)θk(1−θ)n−k である。従って
Pr(y=k)=∫01(kn)θk(1−θ)n−kdθ となる。ここで、ベータ関数は
B(z1,z2)=∫01tz1−1(1−t)z2−1dt であるので、
∫01θ(k+1)−1(1−θ)(n−k+1)−1dθ=Γ(k+1+n−k+1)Γ(k+1)Γ(n−k+1)=Γ(n+2)Γ(k+1)Γ(n−k+1) である。ベータ関数は
B(a,b)=Γ(a+b)Γ(a)Γ(b) とガンマ関数を用いて表現できる。ガンマ関数は整数の範囲で
Γ(k)=(k−1)! となる。全部まとめて、
Pr(y=k)=k!(n−k)!n!(n+1)!k!(n−k)!=n+11 である。 コインの表が出る確率θを0から1で一様と考えているとき、表が出る回数yの事前予測分布はコインを振る回数nの範囲内で一様分布している。
θはBeta(α,β)に従うとする。今、n回コインを振り、y回表が出たことを観測した。 θの事後分布の平均α+β+nα+yは常に事前分布の平均α+βαと相対頻度nyの間に位置することを確認せよ。
zがxとyの間に位置するという関係は1次元の凸結合を考えればよい。 z=ax+byでa+b=1の時、zはxとyの線分上にある。 事後分布の平均を以下の関係式で表現する。
α+β+nα+y=tα+βα+(1−t)ny 0≤t≤1であれば、その2つの間にあるということになる。tに関して解くと
t=α+β+nα+β となる。よってtは常に0<t<1であるので、 θの事後分布の平均α+β+nα+yは常に事前分布の平均α+βαと相対頻度nyの間に位置する。
θは一様分布に従うとする。θの事後分布の分散は常に事前分布の分散より小さいことを示せ。
Beta(1,1)はUniform(0,1)と同等である。 Beta(α,β)の分散は(α+β)2(α+β+1)αβである。 よって、θの事前分布の分散は22(1+1+1)1=121となる。 Beta分布は二項分布の共役事前分布なのでθの事後分布はBeta(1+y,1+n-y)となる。 その分散は
(α+β)2(α+β+1)αβ=(1+y+1+n−y)2(1+y+1+n−y+1)(1+y)(1+n−y)=(2+n)2(3+n)(1+y)(1+n−y) 相加相乗平均の不等式xy≤2x+y→xy≤41(x+y)2を使う。
≤41(2+n1+y+2+n1+n−y)3+n1=413+n1<121 従って、θの事後分布の分散は事前分布の分散1/12より常に小さい。
(c)は一様分布(Beta(1,1))の時のみ分散が小さくなることを確認したが、他の場合はどうなるか確認する。
using Distributions
var.([Beta(1,1), Beta(2,2), Beta(3,5), Beta(5,3)])
4-element Vector{Float64}:
0.08333333333333333
0.05
0.026041666666666668
0.026041666666666668
この結果から言えることはBeta分布の分散はα、βが大きくなれば常に小さくなるということである。 事前分布Beta(a,b)に対し、事後分布はBeta(a+y,b+n-y)であるので、事後分布のα、βは常に大きくなる。 そのため、事後分布の分散は事前分布の分散より常に小さい。