LCE Kotisivu

S-114.600 Bayesilaisen mallintamisen perusteet

 

Mallin tarkistus

Valon nopeuden arviointi. Simon Newcomb mittasi vuonna 1882 valon nopeutta, mittaamalla aikaa joka valolla meni 7442 metrin matkaan. Mitatut ajat on ilmoitettu poikkeamana 24800 nanosekunnista.

Sovita dataan normaalijakaumamalli (tuntematon odotusarvo ja hajonta) ja suorita mallin tarkistus. Koska mittauksia on paljon (n=66) voit käyttää maximum likelihood ratkaisua, eli laske datan odotusarvo ja hajonta.

Data on tiedostossa check.dat. Voit muodostaa 1000 replikaattidataa posterioriprediktiivisestä jakaumasta esim. näin

d=load('check.dat','-ascii');
R = normrnd(mean(d),std(d),length(d),1000)
R on length(d)*1000 matriisi jonka yhdellä sarakkeella on yksi replikaatti (eli 66 näytettä posterioriprediktiivisestä jakaumasta). Voit laskea näitten replikaattidatojen ominaisuuksia esim näin:
 q=min(R);
jolloin q on 1x1000 vektori, eri replikaattidatojen minimi-arvoja.

Voit laskea posterioriprediktiivisen p-arvon näin:

mean(q>min(d))
q > min(d) palauttaa totuusvektorin onko replikoitu testiarvo isompi kuin datasta laskettu testiarvo, ja mean laskee kuinka moni oli isompi jaettuna replikaatioiden määrällä.

Voit piirttää myös kuvan

hist(q)
line([min(d) min(d)],get(gca,'YLim'))

Mallin tarkistuksessa vertaa dataa posterioriprediktiivisiin jakaumiin. Vertaa posterioriprediktiivisestä jakaumasta arvotun samankokoisen datan ja oikean datan erilaisia ominaisuuksia. Testaa ainakin (voit keksiä myös muita)

Tee kuva jossa on useiden posterioriprediktiivisestä jakaumasta simuloitujen tulosten histogrammi ja datasta lasketun vastaavan suureen arvo.

Mieti seuraavia kysymyksiä

Huomaa, että tämä data on hyvin yksinkertainen, ja oikeissa ongelmissa voi mallin ja datan välisiä ristiriitoja olla paljon vaikeampi huomata, mutta silti näitäkin temppuja kannattaa käyttää.


Tästä sivusta vastaa Aki.Vehtari@hut.fi
Sivua on viimeksi päivitetty 10. 11. 2003
URL: http://www.lce.hut.fi/teaching/S-114.600/ex/check.html