Summary of Poisson Regression in Spatio-Temporal Model
Target(\(y\))이 셀 수 있는 이산형(Discrete)일 때 사용하는 모형
관심있는 모수(Parameter) : \(y\)의 평균 \(\lambda_{i}=E(y_{i})\) \[\begin{align*} y_{i} &\thicksim Poisson(\lambda_{i}), \;\; \lambda_{i} = E(y_{i})\\ \eta_{i} &= \log{\lambda_{i}} = \beta_{0}+ \sum_{j} \beta_{j}x_{ji}\\ \beta_{j} &\thicksim Normal \end{align*}\]
\(\exp(\beta_{0})\)
\(\exp(\beta_{j})\)
실제로 \(y\)의 평균 보다 "Rate"
or "Relative Risk"
에 더 관심있으며, Poisson Regression의 목적은 Relative Risk을 추정하는 것
이다. 왜냐하면 단순히 “수”로는 어느 게 크고 작은지 또는 높고 낮은지 정확하게 판단할 수 있는 기준이 없기 때문이다.
\[\begin{align*} y_{i} &\thicksim Poisson(\lambda_{i}), \;\; \lambda_{i} = E_{i}\rho_{i}\\ \eta_{i} &= \log{\rho_{i}}= \log{\frac{\lambda_{i}}{E_{i}}} = \beta_{0}+ \sum_{j} \beta_{j}x_{ji}\\ \beta_{j} &\thicksim Normal \end{align*}\]
"Rate"
or "Relative Risk"
"Rate"
or "Relative Risk"
의 변화"Rate"
or "Relative Risk"
의 변화실제로 상대적 위험(Relative Risk)의 추정값으로 가장 많이 쓰이는 것은 SMR(Standardized Mortality Ratio)이다.
\[\begin{align*} \hat{\rho}_{i} = \frac{y_{i}}{E_{i}} \end{align*}\]
\(y_{i}\) : \(i\)에서의 결과값
\(E_{i}\) : \(i\)에서의 예측된 값
\(\hat{\rho}_{i}>1\) : 예상된 것보다 위험이 높다.
\(\hat{\rho}_{i}=1\) : 예상된 것과 같다.
\(\hat{\rho}_{i}<1\) : 예상된 것보다 위험이 낮다.
공간적 패턴을 파악
하거나 상대적 위험(Relative Risk)이 높고 낮은 지역 식별
흔하게 사용하는 예상되는 수 (\(E_{i}\))는 \[\begin{align*} E_{i} = n_{i}\frac{\sum y_{i}}{\sum n_{i}}, \end{align*}\]
(참고 : Bayesian Disease Mapping: Hierarchical Modeling in Spatial Epidemiology p.85)
\[\begin{align*} \hat{\rho_{i}} &= \frac{y_{i}}{E_{i}} = \frac{y_{i}/n_{i}}{\sum y_{i}/ \sum n_{i}}. \end{align*}\]
\(i\)번째 지역에서의 결과값을 \(y_{i}\)라고 할 때,
\[\begin{align*} y_{i} &\thicksim Poisson(\lambda_{i}), \;\; \lambda_{i} = E_{i}\rho_{i}\\ \eta_{i} &= \log{\rho_{i}} = b_{0} + u_{i} + v_{i} \end{align*}\]
공간 의존성(Spatial Dependency)
을 포함
\[\begin{align*} &u_{i} \vert u_{-i} \thicksim N(m_{i}, s^2_{i}),\\ &m_{i} = \frac{\sum_{j \in \mathcal{N}_{i}} u_{j}}{{\# \mathcal{N}_{i}}} ,\;\; s^2_{i} = \frac{\sigma^2_{u}}{\# \mathcal{N}_{i}}, \end{align*}\]
\(\mathcal{N}_{i}\) : \(i\) 번째 지역과 근접한 이웃 지역 집합
\(\# \mathcal{N}_{i}\) : \(i\) 번째 지역과 근접한 이웃 지역 갯수
\(m_{i}\) : \(i\) 번째 지역과 근접한 이웃 지역들의 \(u_{j}\) 평균
\(s^2_{i}\) : 근접한 이웃 수에 의존
공간 상관관계는 iCAR을 사용
\[\begin{align*} v_{i} \thicksim N(0, \sigma^2_{v}) \end{align*}\]
BYM Model에서의 모수 (Parameter)는 \(log{\tau_{u}}\), \(log{\tau_{v}}\) , where \(\tau_{u} = 1/{\sigma^2_{u}}\), \(\tau_{v} = 1/{\sigma^2_{v}}\)
\(u_{i}\)와 \(v_{i}\)는 독립적으로 해석할 수 없으며, 오직 \(\xi_{i}=u_{i}+v_{i}\)로 공간 효과를 식별할 수 있다.
흔하게 사용하는 예상되는 수 (\(E_{it}\))는 \[\begin{align*} E_{it} = n_{it}\frac{\sum_{t}\sum_{i} y_{it}}{\sum_{t}\sum_{i} n_{it}}, \end{align*}\]
(참고 : Bayesian Disease Mapping: Hierarchical Modeling in Spatial Epidemiology p.293)
\[\begin{align*} \hat{\rho_{it}} &= \frac{y_{it}}{E_{it}} = \frac{y_{it}/n_{it}}{\sum_{t}\sum_{i} y_{it}/\sum_{t}\sum_{i} n_{it}}. \end{align*}\]
\(t\)시간에서 \(i\)번째 지역의 결과값을 \(y_{it}\)라고 할 때, \[\begin{align*} y_{it} &\thicksim Poisson(\lambda_{it}), \;\; \lambda_{it} = E_{it}\rho_{it}\\ \eta_{it} &= \log{\rho_{it}} = b_{0} + u_{i} + v_{i} + (\beta+\delta_{i})*t\\ \delta_{i} &\thicksim N(0, \sigma^2_{\delta}) \end{align*}\]
➤ Classical Parametric Trend는 선형추세만을 가정한다
\(t\)시간에서 \(i\)번째 지역의 결과값을 \(y_{it}\)라고 할 때, \[\begin{align*} y_{it} &\thicksim Poisson(\lambda_{it}), \;\; \lambda_{it} = E_{it}\rho_{it}\\ \eta_{it} &= \log{\rho_{it}} = b_{0} + u_{i} + v_{i} + \gamma_{t} + \phi_{t} \end{align*}\]
➤ Nonparametric Dynamic Trend는 선형성 조건을 완하하기 위하여 Dynamic nonparametric 형태를 취한다.
Nonparametric Dynamic Trend는 시간적으로 구조화된 요소(\(\gamma_{t}\))와 비구조화된 요소(\(\phi_{t}\)) 두 가지를 모두 고려한다.
Nonparametric Dynamic Trend에서 구조화된 시간 효과(\(\gamma_{t}\))는 Random Walk(RW)
를 사용하여 모형화한다.
\[\begin{align*} \gamma_{t} \vert \gamma_{t-1} \thicksim N(\gamma_{t-1}, \sigma^2_{\gamma}), \text{RW of order 1},\\ \gamma_{t} \vert \gamma_{t-1}, \gamma_{t-2} \thicksim N(2\gamma_{t-1} + \gamma_{t-2}, \sigma^2_{\gamma}), \text{RW of order 2} \\ \end{align*}\]
\[\begin{align*} \phi_{t} \thicksim N(0, \sigma^2_{\pi}) \end{align*}\]
공간 및 시간 모형은 전반적인 공간과 시간 패턴을 파악하기 때문에, 모든 시간 또는 모든 공간에 대해 변하지 않는다. 그렇기 때문에 시공간 상호작용은 공간과 시간의 주요 요인으로 설명되지 않는 추과 효과를 포착
할 수 있다. 또한 시간에 따른 공간 패턴
도 파악 할 수 있으며, 각 지역의 추세
도 파악할 수 있다. 시공간 상호작용은 다음과 같은 네가지의 Type
을 가진다.
Interaction | Parameter interacting |
---|---|
Type I | \(v_{i}\) and \(\phi_t\) |
Type II | \(v_{i}\) and \(\gamma_t\) |
Type III | \(u_{i}\) and \(\phi_t\) |
Type IV | \(u_{i}\) and \(\gamma_t\) |
\(t\)시간에서 \(i\)번째 지역의 결과값을 \(y_{it}\)라고 할 때, \[\begin{align*} y_{it} &\thicksim Poisson(\lambda_{it}), \;\; \lambda_{it} = E_{it}\rho_{it}\\ \eta_{it} &= \log{\rho_{it}} = b_{0} + u_{i} + v_{i} + \gamma_{t} + \phi_{t} + \delta_{it} \end{align*}\]
Text and figures are licensed under Creative Commons Attribution CC BY 4.0. The figures that have been reused from other sources don't fall under this license and can be recognized by a note in their caption: "Figure from ...".