Markov Model?

Untitled

오랫동안 기상관측을 했을 때, 위와 같은 통계를 얻었다. 이때, Rainy, Rainy, Sunny, Cloudy가 연속으로 있을 확률은 $P(\mathrm{Rainy, Rainy, Sunny, Cloudy})$을 구하고자 한다.

위와 같은 결합확률의 Sequence가 길어질 수록 확률을 구하기 매우 어려워진다.

$$ \begin{align*} &P(y_1, y_2, \dots, y_t)\\ &= P(y_1)P(y_2|y_1)P(y_3|y_1, y_2)\dots P(y_t|y_1, y_2, \dots, y_{t-1})

\end{align*} $$

Markov Assumption

따라서 현재 State의 영향을 주는 것은 바로 직전의 State밖에 없다. 라는 가정을 한다.

$$ \approx P(y_1)P(y_2|y_1)P(y_3|y_2)\dots P(y_t|y_{t-1}) $$

이것을 1차 markov assumption이라고 한다. 이전 state를 얼마나 고려하는가에 따라서 2차, 3차로 나뉘며 Data의 양에 따라 선택한다.

Markov Model

Untitled

Untitled

Markov model은 위와 같이 그릴 수 있다. 위에서 구하고자 했던것을 구해보자.

$$ \mathrm {State} = \{ S_1:\mathrm{Rainy}, S_2, \rm{Cloudy}, S_3, \rm{Sunny} \}\\ $$

$$ \begin{align*} &P(S_1, S_1, S_3, S_2|model)\\ &= P(S1)P(S1|S1)P(S_3|S_1)P(S_2|S_3)\\ &= 1\times 0.4\times 0.3\times 0.1\\ &=0.012

\end{align*} $$

저 $P(S_1)$은 1이라 가정해둔다.

Hidden Markov Model

Hidden?

위에서 말한 $\rm{Rainy, Cloudy, Sunny}$이런 것들을 State라고 한다. Hidden은 이러한 State를 직접 관찰할 수 없고 다른 관측에 의해서만 예측할 수 있다는 것이다.