next up previous contents
Next: Multivariate PSRF (MPSRF) Up: Testatut ja toimivaksi havaitut Previous: Hairiness-diagnostiikka

Potential Scale Reduction Factor (PSRF)

PSRF-menetelmän periaatteena on tutkia useampaa riippumatonta sekvenssiä yhtäaikaa ja pyrkiä arvioimaan konvergenssia niiden yhteiskäyttäytymisen perusteella. Aluksi simuloidaan $m \ge 2$ kappaletta 2n pituisia sekvenssejä, aloittaen erilaisista stationääristä jakaumaa ''leveämmän'' jakauman pisteistä. Tutkittavalle skalaariarvoiselle statistiikalle $T(\theta)$ lasketaan B/n, eli varianssi m sekvessikeskiarvon (merk. $\overline{T}_i$) välillä

\begin{displaymath}
\frac{B}{n} = \frac{1}{m-1} \sum_{i=1}^m
 (\overline{T}_i - \overline{T})^2,\end{displaymath} (24)

jossa sekvenssin j keskiarvo $\overline{T}_j$ on laskettu simuloitujen arvojen $\theta^{(i,j)}$ avulla:

\begin{displaymath}
\overline{T}_j = \frac{1}{n} \sum_{i=n+1}^{2n} T(\theta^{(i,j)})\end{displaymath} (25)

sekä yhteiskeskiarvo $\overline{T}$ keskiarvojen keskiarvona:

\begin{displaymath}
\overline{T} = \frac{1}{m} \sum_{j=1}^{m} \overline{T}_j.\end{displaymath} (26)

Lisäksi lasketaan arvo W, joka on simulaatioiden sisäisten varianssien keskiarvo:

\begin{displaymath}
W = \frac{1}{m} \sum_{j=1}^{m} s_j^2,\end{displaymath} (27)

jossa

\begin{displaymath}
s_j^2 = \frac{1}{n} \sum_{i=n+1}^{2n}
 (T(\theta^{(i,j)}) - \overline{T}_j)^2.\end{displaymath} (28)

Konvergenssia voidaan tarkkailla arvon $\hat{R}$ avulla, joka kuvaa sitä, että kuinka paljon posteriorijakauman skaala vielä pienenee kun $n \rightarrow \infty$. Äärettömyydessä $\hat{R}$lähestyy arvoa 1. Arvo voidaan laskea lausekkeesta

\begin{displaymath}
\hat{R} = \frac{\hat{V}}{W},\end{displaymath} (29)

jossa $\hat{V}$ on (harhaton) estimaatti kohdejakauman varianssille $\sigma^2$:

\begin{displaymath}
\hat{V} = \frac{n-1}{n} W + \left( 1 + \frac{1}{m} \right) \frac{B}{n}\end{displaymath} (30)

Teoreettinen arvo tälle $\hat{R}$:lle on 1, kun $n \rightarrow \infty$.Gelmanin ja Rubinin mukaan tämä Potentiaalinen skaalanvähenemiskerroin (Potential Scale Reduction Factor) voidaan tulkita konvergenssimittana seuraavasti. Jos $\hat{R}$ on suuri, joko varianssiestimaattia $\hat{V}$saadaan pienennettyä lisäsimulaatioilla, tai lisäsimulaatiot kasvattavat W:tä, koska simulaatiot eivät ole vielä saavuttaneet kohdejakaumaa kokonaan.

Pelkän $\hat{R}$:n seuraamisen sijaan voidaan tarkkailla myös $\hat{V}$:n ja W:n arvoja. Hyvän kuvan konvergenssin kulusta saa tutkimalla näiden kaikkien arvojen käyttäytymistä ajan suhteen (siis kumulatiivisesti) tai jakamalla näytesekvenssi k osaan ja tutkimalla näitä osasekvenssejä erikseen. Lähellä konvergoitumista $\hat{V}$ ja W lähestyvät toisiaan ja $\hat{R}$lähestyy ykköstä.

Kirjassa (Gelman et al., 1995) sivulla 322 ehdotetaan, että konvergenssin tutkimiseksi kannattaa ajaa useita MCMC-simulaatioita lähtien eri alkupisteistä. Simulointia jatketaan kunnes tutkittavan statistiikan $\sqrt{\hat{R}}$ on lähellä arvoa 1, esimerkiksi selvästi alle 1.2.

\includegraphics [width=12cm, height=10cm, angle=0]{psrf.eps}

next up previous contents
Next: Multivariate PSRF (MPSRF) Up: Testatut ja toimivaksi havaitut Previous: Hairiness-diagnostiikka
Simo Särkkä
8/23/1999