Bayesian Modeling and Inference forHigh-Dimensional Spatiotemporal Datasets
Sudipto Banerjee
University of California, Los Angeles, USA
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Based upon projects involving:I Abhirup Datta (Johns Hopkins University)I Andrew O. Finley (Michigan State University)I Nicholas A.S. Hamm (University of Twente)I Martjin Schaap (TNO Built Environment and Geosciences)
Example 1: U.S. forest biomass data
Figure: Observed biomass (left) and NDVI (right)
I Forest biomass data collected over 114,371 plotsI Normalized Difference Vegetation Index (NDVI) is a measure of
greennessI Forest Biomass Regression Model:
Biomass(`) = Ξ²0(`) + Ξ²1(`)NDVI(`) + error
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Example 2: European Particulate Matter (PM10) data
Easting (km)
No
rth
ing
(km
)
05
00
10
00
15
00
20
00
25
00
0 500 1000 1500 2000 2500
β
β βββ
ββ
ββ β
β
ββ
β
βββ
βββββββ
βββ ββ βββββ
ββ
β β
ββ
β
ββββ
β
β
β ββ
β
ββ
β β
ββββ
β β
βββ β
β
β
β
β
ββ
β
β
β
β
β
β
β
ββ
β
β
β
β
ββ
β
β
β
β
β
β
β
β
β
β
β β
β
β
β
β β β
β
β
β
β
β
β
β
β
β
β
β
ββ
β
β β
β
β
β
β β
βββ
β
β
βββ
β
ββ β
βββ
β
β
β
β
β
β
β
β
ββ
β
β
β
β
β β
β
β
β
ββ
ββ
β
β
β β
β
β
β
β
β
β
β
β
ββ β
β
β
β
β
β
ββ
βββ
β
ββ
ββ
β
β
β
β
βββ
ββ
β
β
β
β
β β
βββ
β
β
β
ββ
β
β
β
β
β
20
40
60
80
100
(a) PM10 levels in March, 2009
Easting (km)
No
rth
ing
(km
)
05
00
10
00
15
00
20
00
25
00
0 500 1000 1500 2000 2500
β
β βββ
ββ
ββ β
β
ββ
β
βββ
βββββββ
ββ ββ βββ βββ
ββ
β β
ββ
β
βββ
β
ββ
β β β
β
β
β
ββ
β
βββ
β ββ β
β
β
β
β
ββ
β
β
β
β
β
β
β
ββ
β
β
β
β
ββ
β
β
β
ββ
β
β
β
β
β
β
β β
β
β
β
β
β β β
β
β
β
β
β
β
β
β
β
ββ
β β
β
β
β
β
β
β
β
βββ
β
ββ
β
βββ β
βββ
ββ
β
β
β
β
ββ
β
β
β
β
β β
β
β
β
β
ββ
ββ
β
β
β β
β
β
β
β
β
β
β
β
ββ
β
β
β
β
β
ββ
β
ββ β
ββββ
ββ
β
β
β
β
β
βββ
ββ
ββ
β
β
β
β
β
β
βββ
β
β
β
ββ
β
β
β
β
51015202530354045
(b) PM10 levels in June, 2009
I Significant variation across space and time
I Daily observations at 308 stations for 2 years i.e.,n = 308Γ 730 = 224, 840
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Example 2: European PM10 data
I Computer models likeChemistry Transport Model(CTM) consistentlyunderestimate PM10 levels
I CTM outputs used ascovariates to improve fitslog(PM10)(`) =Ξ²0(`) + Ξ²1(`)CTM(`) + Ξ΅(`)
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Example 3: Tanana Valley (Alaska) forest canopy height analysis
(a) (b)
Figure: Tanana vally, Alaska, study region. (a) G-LiHT flight lines wherecanopy height was measured at βΌ 6Γ 106 locations over the percent forestcanopy covariate. (b) Occurrence of forest fire in the past 20 years and areasof interest for prediction illustration.
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Spatiotemporal regression models
I Y(`) = Ξ²0(`) + X(`)Ξ²1(`) + e(`)
I Produce maps for intercept and slope:
{Ξ²0(`) : ` β L} and {Ξ²1(`) : ` β L}
I L is spatial domain (e.g., D β <d) or spatiotemporal domain(e.g., D β <d Γ<+)
I Potentially very rich: understand spatially- and/ortemporally-varying impact of predictors on outcome.
I Model-based predictions: Y(`0) | {y(`1), y(`2), . . . , y(`n)}.
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Gaussian spatiotemporal process
I {w(`) : ` β L} βΌ GP(0,KΞΈ(Β·, Β·)) implies
w = (w(`1),w(`2), . . . ,w(`n))> βΌ N(0,KΞΈ)
for every finite set of points `1, `2, . . . , `n.
I KΞΈ = {KΞΈ(`i, `j)} is a spatial variance-covariance matrix
I Stationary: KΞΈ(`, `β²) = KΞΈ(`β `β²). Isotropy:KΞΈ(`, `β²) = KΞΈ(β`β `β²β).
I With βnuggetβ (esp. when modeling data): KΞΈ = C(Ο,Ο) + DΟ ,where ΞΈ = {Ο, Ο, Ο}
I No nugget (esp. when modeling random effects): KΞΈ = C(Ο,Ο),where ΞΈ = {Ο, Ο}
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Likelihood from (full rank) GP models
I L = {`1, `2, . . . , `n} are locations where data is observed
I y(`i) is outcome at the ith location, y = (y(`1), y(`2), . . . , y(`n))>
I Model: y βΌ N(XΞ²,KΞΈ)
I Estimating process parameters from the likelihood:
β12
log det(KΞΈ)β12
(yβ XΞ²)>Kβ1ΞΈ (yβ XΞ²)
I Bayesian inference: Priors on {Ξ², ΞΈ}
I Challenges: Storage and chol(KΞΈ) = LDL>.
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Burgeoning literature on spatial big data
I Low-rank models (Wahba, 1990; Higdon, 2002; Kamman & Wand,2003; Paciorek, 2007; Rasmussen & Williams, 2006; Stein 2007, 2008;Cressie & Johannesson, 2008; Banerjee et al., 2008; 2010; Gramacy &Lee 2008; Sang et al., 2011, 2012; Lemos et al., 2011; Guhaniyogi etal., 2011, 2013; Salazar et al., 2013; Katzfuss, 2016)
I Spectral approximations and composite likelihoods: (Fuentes 2007;Paciorek, 2007; Eidsvik et al. 2016)
I Multi-resolution approaches (Nychka, 2002; Johannesson et al., 2007;Matsuo et al., 2010; Tzeng & Huang, 2015; Katzfuss, 2016)
I Sparsity: (Solve Ax = b by (i) sparse A, or (ii) sparse Aβ1)1. Covariance tapering (Furrer et al. 2006; Du et al. 2009; Kaufman
et al., 2009; Shaby and Ruppert, 2013)2. GMRFs to GPs: INLA (Rue et al. 2009; Lindgren et al., 2011)3. LAGP (Gramacy et al. 2014; Gramacy and Apley, 2015)4. Nearest-neighbor models (Vecchia 1988; Stein et al. 2004; Stroud
et al 2014; Datta et al., 2016)Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Reduced (Low) rank models
I KΞΈ β BΞΈKβΞΈB>ΞΈ + DΞΈ
I BΞΈ is nΓ r matrix of spatial basis functions, r << n
I KβΞΈ is r Γ r spatial covariance matrix
I DΞΈ is either diagonal or sparse
I Examples: Kernel projections, Splines, Predictive process, FRK,spectral basis ...
I Computations exploit above structure: roughlyO(nr2) << O(n3) flops
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Oversmoothing due to reduced-rank models
(a) True w (b) Full GP (c) PPGP 64 knots
Figure: Comparing full GP vs low-rank GP with 2500 locations. Figure(4(c)) exhibits oversmoothing by a low-rank process (predictive process with64 knots)
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Simple method of introducing sparsity (e.g. graphical models)
Full dependency graph
1
2
3
4
5
67
p(y1)p(y2 | y1)p(y3 | y1, y2)p(y4 | y1, y2, y3)Γ p(y5 | y1, y2, y3, y4)p(y6 | y1, y2, . . . , y5)p(y7 | y1, y2, . . . , y6) .
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Simple method of introducing sparsity (e.g. graphical models)
3βNearest neighbor dependency graph
1
2
3
4
5
67
p(y1)p(y2 | y1)p(y3 | y1, y2)p(y4 | y1, y2, y3)p(y5 |οΏ½οΏ½y1, y2, y3, y4)p(y6 | y1,οΏ½οΏ½y2,οΏ½οΏ½y3, y4, y5)p(y7 | y1, y2,οΏ½οΏ½y3,οΏ½οΏ½y4,οΏ½οΏ½y5, y6)
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Gaussian graphical models: linearity
I Write a joint density p(w) = p(w1,w2, . . . ,wn) as:
p(w1)p(w2 |w1)p(w3 |w1,w2) Β· Β· Β· p(wn |w1,w2, . . . ,wnβ1)
I Example: For Gaussian distribution N(w | 0,KΞΈ), we have alinear model
w1 = 0 + Ξ·1;w2 = a21w1 + Ξ·2;w3 = a31w1 + a32w2 + Ξ·3;wi = ai1w1 + ai2w2 + Β· Β· Β·+ ai,iβ1wiβ1 + Ξ·i; i = 4, . . . , n .
I More compactly: w = Aw + Ξ· ; Ξ· βΌ N(0,D).
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Simple method of introducing sparsity (e.g. graphical models)
I For Gaussian distribution N(w | 0,KΞΈ),
KΞΈ = (I β A)β1D(I β A)β> D = diag(var{wi |w{j<i}})
I If L is from chol(KΞΈ) = LDL>, then Lβ1 = I β A.
I aijβs obtained from nβ 1 linear systems implied byβj<i:jβΌi
aijwj = E[wi |w{j<i}] i = 2, . . . , n
I Example:
for(i in 1:n) {
a[i+1,] = solve(K[1:i,1:i], K[i, 1:i])
}
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
I Let aij = 0 for all but m nearest neighbors of node i impliessolving β
jβN[i]aijwj = E[wi |w{jβN[i]}] i = 2, . . . , n ,
where N[i] = {j < i : j βΌ i} are indices for neighbors of i fromits βpast.β
I Example:
for(i in 1:n) {
a[i+1,] = solve(K[N[i],N[i]], K[i, N[i]])
}
I We need to solve nβ 1 linear systems of size at most mΓ mI We effectively model a (sparse) Cholesky factor instead of
computing it
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Sparse precision matrices
N(wR | 0, KΞΈ) β N(wR | 0, KΜΞΈ) ; KΜβ1ΞΈ = (I β A)>Dβ1(I β A)
(a) I β A (b) Dβ1 (c) KΜβ1ΞΈ
I det(KΜβ1ΞΈ ) =
βni=1 Dβ1
ii , KΜβ1ΞΈ is sparse with O(nm2) entries
(a) I β A (b) Dβ1 (c) KΜβ1ΞΈ
I det(KΜβ1ΞΈ ) =
βni=1 Dβ1
ii , KΜβ1ΞΈ is sparse with O(nm2) entries
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Sparse precision matrices
N(wR | 0, KΞΈ) β N(wR | 0, KΜΞΈ) ; KΜβ1ΞΈ = (I β A)>Dβ1(I β A)
(a) I β A (b) Dβ1 (c) KΜβ1ΞΈ
I det(KΜβ1ΞΈ ) =
βni=1 Dβ1
ii , KΜβ1ΞΈ is sparse with O(nm2) entries
(a) I β A (b) Dβ1 (c) KΜβ1ΞΈ
I det(KΜβ1ΞΈ ) =
βni=1 Dβ1
ii , KΜβ1ΞΈ is sparse with O(nm2) entries
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Sparse precision matrices
N(wR | 0, KΞΈ) β N(wR | 0, KΜΞΈ) ; KΜβ1ΞΈ = (I β A)>Dβ1(I β A)
(a) I β A (b) Dβ1 (c) KΜβ1ΞΈ
I det(KΜβ1ΞΈ ) =
βni=1 Dβ1
ii , KΜβ1ΞΈ is sparse with O(nm2) entries
(a) I β A (b) Dβ1 (c) KΜβ1ΞΈ
I det(KΜβ1ΞΈ ) =
βni=1 Dβ1
ii , KΜβ1ΞΈ is sparse with O(nm2) entries
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Sparse precision matrices
N(wR | 0, KΞΈ) β N(wR | 0, KΜΞΈ) ; KΜβ1ΞΈ = (I β A)>Dβ1(I β A)
(a) I β A (b) Dβ1 (c) KΜβ1ΞΈ
I det(KΜβ1ΞΈ ) =
βni=1 Dβ1
ii , KΜβ1ΞΈ is sparse with O(nm2) entries
(a) I β A (b) Dβ1 (c) KΜβ1ΞΈ
I det(KΜβ1ΞΈ ) =
βni=1 Dβ1
ii , KΜβ1ΞΈ is sparse with O(nm2) entries
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Sparse likelihood approximations (Vecchia, 1988; Stein et al., 2004)
I LetR = {`1, `2, . . . , `r}
I With w(`) βΌ GP(0,KΞΈ(Β·)), write the joint density p(wR) as:
N(wR | 0,KΞΈ) =rβ
i=1
p(w(`i) |wH(`i))
βrβ
i=1
p(w(`i) |wN(`i)) = N(wR | 0, KΜΞΈ) .
where N(`i) β H(`i).
I Shrinkage: Choose N(`) as the set of βm nearest-neighborsβamong H(`i). Theory: βScreeningβ effect of kriging.
I KΜβ1ΞΈ depends on KΞΈ, but is sparser with at most nm2 non-zero
entries
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Extension to a GP (Datta et al., JASA, 2016)
I Fix βreferenceβ setR = {`1, `2, . . . , `r} (e.g. observed points)
I N(`i) is the set of at most m nearest neighbors of `i among{`1, `2, . . . , `iβ1}.
I First piece: Model wR βΌ N(0, KΜΞΈ) (βVecchia priorβ)
I Second piece: If ` /β R, then N(`) is the set of m-nearestneighbors of ` inR
I Third piece: w(`) =βr
i=1 ai(`)w(`i) + Ξ·(`) with ai(`) = 0 if`i /β N(`).
I Nonzero ai(`)βs obtained by solving mΓ m system:
E[w(`) |wN(`)] =β
i:`iβN(`)ai(`)w(`i)
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Neighbors in Space and Time
I No universal definition of distance in a space-time domain
I Use KΞΈ(Β·, Β·) as a proxy for distance
I Datta et al. (2016, AoAS): Efficient algorithm βΌ O(4nm) flopsto do this
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Example 1: Hierarchical NNGP model
I Start with a desired full GP specification: GP(0,KΞΈ(Β·))I Derive the NNGP: NNGP(0, KΜΞΈ(Β·))
Y(`) indβΌ PΞΈ exponential family ;g(E[Y(`)]) = Ξ²0(`) + X(`)Ξ²1(`)
(Ξ²0(`), Ξ²1(`))> βΌ NNGP(Ξ²Μ0 + X(`)Ξ²Μ1, KΜΞΈ(Β·))(Ξ²Μ0, Ξ²Μ1)> βΌ N(0,VΞ²) ; ΞΈ βΌ p(ΞΈ)
I Posterior predictive inference for Ξ²0(`0), Ξ²1(`0) and Y(`0)
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Example 2: Hierarchical NNGP model
I Start with a desired full GP specification for Y(`):Y(`) βΌ GP(x>(`)Ξ²,KΞΈ(Β·))
I Derive the NNGP: Y(`) βΌ NNGP(x>(`)Ξ², KΜΞΈ(Β·))
Y βΌ N(XΞ², KΜΞΈ) ;Ξ² βΌ N(0,VΞ²) ; ΞΈ βΌ p(ΞΈ)
I No need for Cholesky: it is modeled.I Easy posterior predictive inference for Y(`0) at new `0.I But no latent spatial-temporal process
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
(a) True w (b) Full GP (c) PPGP 64 knots
(d) NNGP, m = 10 (e) NNGP, m = 20
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
β
β
β
β
β
β β
β β β β β β β β β β β β β β β β β β
m
RM
SP
E
1.15
1.20
1.25
1.30
1.35
β
β
β
β
ββ
ββ
β β β β β β β β β β β β β β β β β
2.10
2.15
2.20
2.25
2.30
2.35
2.40
Me
an
95
% C
I w
idth
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
β
β
NNGP RMSPENNGP Mean 95% CI widthFull GP RMSPEFull GP Mean 95% CI width
Figure: Choice of m in NNGP models: Out-of-sample Root Mean SquaredPrediction Error (RMSPE) and mean width between the upper and lower95% posterior predictive credible intervals for a range of m for the univariatesynthetic data analysis
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Back to European PM10 data
Easting (km)
No
rth
ing
(km
)
05
00
10
00
15
00
20
00
25
00
0 500 1000 1500 2000 2500
β
β βββ
ββ
ββ β
β
ββ
β
βββ
βββββββ
βββ ββ βββββ
ββ
β β
ββ
β
ββββ
β
β
β ββ
β
ββ
β β
ββββ
β β
βββ β
β
β
β
β
ββ
β
β
β
β
β
β
β
ββ
β
β
β
β
ββ
β
β
β
β
β
β
β
β
β
β
β β
β
β
β
β β β
β
β
β
β
β
β
β
β
β
β
β
ββ
β
β β
β
β
β
β β
βββ
β
β
βββ
β
ββ β
βββ
β
β
β
β
β
β
β
β
ββ
β
β
β
β
β β
β
β
β
ββ
ββ
β
β
β β
β
β
β
β
β
β
β
β
ββ β
β
β
β
β
β
ββ
βββ
β
ββ
ββ
β
β
β
β
βββ
ββ
β
β
β
β
β β
βββ
β
β
β
ββ
β
β
β
β
β
20
40
60
80
100
(a) PM10 levels in March, 2009
Easting (km)
No
rth
ing
(km
)
05
00
10
00
15
00
20
00
25
00
0 500 1000 1500 2000 2500
β
β βββ
ββ
ββ β
β
ββ
β
βββ
βββββββ
ββ ββ βββ βββ
ββ
β β
ββ
β
βββ
β
ββ
β β β
β
β
β
ββ
β
βββ
β ββ β
β
β
β
β
ββ
β
β
β
β
β
β
β
ββ
β
β
β
β
ββ
β
β
β
ββ
β
β
β
β
β
β
β β
β
β
β
β
β β β
β
β
β
β
β
β
β
β
β
ββ
β β
β
β
β
β
β
β
β
βββ
β
ββ
β
βββ β
βββ
ββ
β
β
β
β
ββ
β
β
β
β
β β
β
β
β
β
ββ
ββ
β
β
β β
β
β
β
β
β
β
β
β
ββ
β
β
β
β
β
ββ
β
ββ β
ββββ
ββ
β
β
β
β
β
βββ
ββ
ββ
β
β
β
β
β
β
βββ
β
β
β
ββ
β
β
β
β
51015202530354045
(b) PM10 levels in June, 2009
I Interest in estimating short and long term temporal (and spatial)decay (to improve the CTMs)
I log(PM10)(s, t) = Ξ²0 + Ξ²1CTM(s, t) + w(s, t) + Ξ΅(s, t)
I w(s, t) βΌ DNNGP(0, KΜΞΈ(Β·))Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
European PM10 Dataset
I Significantly improved fit
OLS DNNGPRMSPE 12.8 8.2
I Total time 24 hrs
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
European PM10 Dataset
Easting (km)
No
rth
ing
(km
)
0 500 1000 1500 2000 2500
05
00
10
00
15
00
20
00
25
00
ββ β
β β β β
β β β β β β β β β
β
β β ββ β β β β β β β β β
β β
β β β β β β β β β β β β β β β
β β β
β β β β β β β β β β β β β β β β β
β β β β β
β β β β β β β β β β β β β β β β
β β β β β β
β β β β β β β β β β β β β β β β β
β β β β β
β β β β β β β β β β β β β β β β β
β
β β β β β β β β β β β β β β β β β ββ
β β β β β β β β β β β β β β β β β β ββ
β
β β β β β β β β β β β β β β β β β β β
ββ β
β β β β β β β β β β β β β β β β β β
β ββ β
β β β β β β β β β β β β β β β β β ββ β
β ββ
β β β β β β β β β β β β β β β β β β
ββ β
ββ
β β β β β β β β β β β β β β β β β β
β β β β ββ
β β β β β β β β β β β β β β β β β β β
β β β β β β β β
β β β β β β β β β β β β β β β β β β β
β β β β β β β β β
β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β
β β β β β β β
β β β β β β β β β β β β β β β β β β β β β ββ β β β β β
β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β
β
β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β ββ β β
β β ββ β β β β ββ β β β ββ β β β β β β
β β β β β β ββ β β β
β β β ββ β β β β β
β β β βββββ
βββββ
Missing[0,20)[20,40)[40,60)[60,80)[80,100)[100,120]
(a) PΜM10 for 04.03.2009
Easting (km)
No
rth
ing
(km
)
0 500 1000 1500 2000 2500
05
00
10
00
15
00
20
00
25
00
ββ β
β β β β
β β β β β β β β β
β
β β ββ β β β β β β β β β
β β
β β β β β β β β β β β β β β β
β β β
β β β β β β β β β β β β β β β β β
β β β β β
β β β β β β β β β β β β β β β β
β β β β β β
β β β β β β β β β β β β β β β β β
β β β β β
β β β β β β β β β β β β β β β β β
β
β β β β β β β β β β β β β β β β β ββ
β β β β β β β β β β β β β β β β β β ββ
β
β β β β β β β β β β β β β β β β β β β
ββ β
β β β β β β β β β β β β β β β β β β
β ββ β
β β β β β β β β β β β β β β β β β ββ β
β ββ
β β β β β β β β β β β β β β β β β β
ββ β
ββ
β β β β β β β β β β β β β β β β β β
β β β β ββ
β β β β β β β β β β β β β β β β β β β
β β β β β β β β
β β β β β β β β β β β β β β β β β β β
β β β β β β β β β
β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β
β β β β β β β
β β β β β β β β β β β β β β β β β β β β β ββ β β β β β
β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β
β
β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β ββ β β
β β ββ β β β β ββ β β β ββ β β β β β β
β β β β β β ββ β β β
β β β ββ β β β β β
β β β βββββ
βββββ
[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)[0.7,0.8)[0.8,0.9)[0.9,1]
(b) Pr(PΜM10 > 50Β΅gmβ3)
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
European PM10 Dataset
Easting (km)
No
rth
ing
(km
)
0 500 1000 1500 2000 2500
05
00
10
00
15
00
20
00
25
00
ββ β
β β β β
β β β β β β β β β
β
β β ββ β β β β β β β β β
β β
β β β β β β β β β β β β β β β
β β β
β β β β β β β β β β β β β β β β β
β β β β β
β β β β β β β β β β β β β β β β
β β β β β β
β β β β β β β β β β β β β β β β β
β β β β β
β β β β β β β β β β β β β β β β β
β
β β β β β β β β β β β β β β β β β ββ
β β β β β β β β β β β β β β β β β β ββ
β
β β β β β β β β β β β β β β β β β β β
ββ β
β β β β β β β β β β β β β β β β β β
β ββ β
β β β β β β β β β β β β β β β β β ββ β
β ββ
β β β β β β β β β β β β β β β β β β
ββ β
ββ
β β β β β β β β β β β β β β β β β β
β β β β ββ
β β β β β β β β β β β β β β β β β β β
β β β β β β β β
β β β β β β β β β β β β β β β β β β β
β β β β β β β β β
β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β
β β β β β β β
β β β β β β β β β β β β β β β β β β β β β ββ β β β β β
β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β
β
β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β ββ β β
β β ββ β β β β ββ β β β ββ β β β β β β
β β β β β β ββ β β β
β β β ββ β β β β β
β β β βββββ
βββββ
Missing[0,10)[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)[70,80)[80,90]
(a) PΜM10 for 04.05.2009
Easting (km)
No
rth
ing
(km
)
0 500 1000 1500 2000 2500
05
00
10
00
15
00
20
00
25
00
ββ β
β β β β
β β β β β β β β β
β
β β ββ β β β β β β β β β
β β
β β β β β β β β β β β β β β β
β β β
β β β β β β β β β β β β β β β β β
β β β β β
β β β β β β β β β β β β β β β β
β β β β β β
β β β β β β β β β β β β β β β β β
β β β β β
β β β β β β β β β β β β β β β β β
β
β β β β β β β β β β β β β β β β β ββ
β β β β β β β β β β β β β β β β β β ββ
β
β β β β β β β β β β β β β β β β β β β
ββ β
β β β β β β β β β β β β β β β β β β
β ββ β
β β β β β β β β β β β β β β β β β ββ β
β ββ
β β β β β β β β β β β β β β β β β β
ββ β
ββ
β β β β β β β β β β β β β β β β β β
β β β β ββ
β β β β β β β β β β β β β β β β β β β
β β β β β β β β
β β β β β β β β β β β β β β β β β β β
β β β β β β β β β
β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β
β β β β β β β
β β β β β β β β β β β β β β β β β β β β β ββ β β β β β
β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β
β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β
β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β
β
β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β ββ β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β β β β β β β β β β β β β β β β β
β β β β β β β β β β ββ β β
β β ββ β β β β ββ β β β ββ β β β β β β
β β β β β β ββ β β β
β β β ββ β β β β β
β β β βββββ
βββββ
[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)[0.7,0.8)[0.8,0.9)[0.9,1]
(b) Pr(PΜM10 > 50Β΅gmβ3)
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Concluding remarks: Storage and computation
I Algorithms: Gibbs, RWM, HMC, VB, INLA; NNGP/HMCespecially promising
I Model-based solution for spatial βBIG DATAβ
I Never needs to store nΓ n distance matrix. Stores n small mΓmmatrices
I Total flop count per iteration is O(nm3) i.e linear in n
I Scalable to massive datasets because m is smallβyou never needmore than a few neighbors.
I Compare with reduced-rank models: O(nm3) << O(nr2).
I New R package spNNGP (on CRAN soon)
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Concluding remarks: Comparisons
I Are low-rank spatial models well and truly beaten?
I Certainly do not seem to scale as nicely as NNGPI Have somewhat greater theoretical tractability (e.g. Bayesian
asymptotics)I Can be used to flexibly model smoothnessI Can be constructed for other processesβe.g., Spatial Dirichlet
Predictive ProcessI Compare with scalable multi-resolution frameworks (Katzfuss,
2016)
I Highly scalable meta-kriging frameworks (Guhaniyogi, 2016)
I Future work: High-dimensional multivariate spatial-temporal variableselection
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models
Thank You !
Sudipto Banerjee (UCLA) Climate Informatics 2016: NNGP models