Juliaの世界

BDA3の2.11 Exercisesの3を解く。 リンクはBayesian Data Analysis

  1. Predictive distributions

サイコロを10回振って6が出た回数をyとする。

(a) yを正規分布で近似する

yは二項分布Binomial(n=1000, p=1/6)に従う。二項分布の平均μμはnpであり、分散σ2σ^2はnp(1-p)である。 yを正規分布近似するとNormal(np,np(1p))\text{Normal}(np,\sqrt{np(1-p)})となる。

using Distributions, StatsPlots
meany=1000*1/6
stdy=sqrt(1000*1/6*(1-1/6))
nay=Normal(meany,stdy)
plot(nay,label="Normal",yrotation=90)
plot!(Binomial(1000,1/6),label="Binomial(1000,1/6)",xlims=(100,250))
savefig(joinpath(@OUTPUT, "Binomial.svg"))
nothing

二項分布を正規分布でよく近似できていることがわかる。

(b) 分位数を計算する

分位数はquantileを使って計算する。正規分布近似の分位数は

q = [0.05,0.25,0.5,0.75,0.95]
nayq = quantile(nay, q)
5-element Vector{Float64}:
 147.28188077205542
 158.71772872992548
 166.66666666666666
 174.61560460340783
 186.05145256127787

となる。二項分布の分位数は

yq = quantile(Binomial(1000,1/6), q)
5-element Vector{Int64}:
 147
 159
 167
 175
 186

となる。表でまとめると

csv="""分位数,$(join(q,","))
正規分布近似,$(join(round.(nayq;digits=2),","))
二項分布,$(join(yq,","))"""
write(joinpath(@OUTPUT,"quantile.csv"), csv)
nothing
分位数0.050.250.50.750.95
正規分布近似147.28158.72166.67174.62186.05
二項分布147159167175186

となる。二項分布が正規分布で近似できるのは中心極限定理のためである。