
베이지안 추론
베이지안 추론과 관련한 몇 가지 개념을 짚고, 예시를 통해 추론 방법을 적용해보고자 합니다.
베이즈 정리 (Bayes’ Theorem): 베이즈 정리는 주어진 데이터 (
)에 대한 파라미터 ( )의 사후 확률 분포를 계산하는 공식입니다. 베이즈 정리는 다음과 같이 표현됩니다:여기서:
: 데이터 ( )가 주어졌을 때 파라미터 ( )의 사후 확률 (Posterior Probability) : 파라미터 ( )가 주어졌을 때 데이터 ( )가 나타날 확률 (우도, Likelihood) : 파라미터 ( )의 사전 분포 (Prior Distribution) : 데이터 ( )의 주변 분포 (Evidence, 증거)
사전 분포 (
, Prior Distribution): 파라미터 ( )에 대한 초기 신념 또는 사전 지식입니다. 데이터가 수집되기 전에 우리가 파라미터 ( )에 대해 갖고 있는 믿음을 나타냅니다.우도 (Likelihood,
): 주어진 파라미터 ( ) 아래에서 데이터 ( )가 나타날 확률입니다. 이는 모델의 파라미터가 주어졌을 때 데이터를 관찰할 확률 분포를 나타냅니다.사후 분포 (Posterior Distribution,
): 데이터 ( )가 주어졌을 때 파라미터 ( )의 갱신된 확률 분포입니다. 이는 사전 분포와 우도를 결합하여 계산됩니다.증거 (Evidence,
): 데이터 ( ) 자체의 확률로, 이는 사전 분포와 우도의 결합을 통해 계산됩니다. 증거는 모든 가능한 파라미터 ( )에 대해 데이터를 관찰할 확률의 총합입니다:
앞면이 나올 확률
사전 분포
사전 분포는 베타 분포로 설정합니다:
여기서
우도
우도는 베르누이 분포로 설정합니다. 데이터
각
베르누이 분포의 확률 질량 함수는 다음과 같습니다:
따라서 전체 데이터
여기서
사후 분포
사후 분포는 베이즈 정리를 사용하여 계산합니다:
이는 다음과 같이 다음과 같이
증거
베타 분포와 베르누이 분포의 특성으로 인해, 사후 분포 역시 베타 분포가 됩니다. 즉, 사후 분포는 다음과 같습니다:
예시
동전을 던져 앞면이 나오면 1, 뒷면이 나오면 0을 기록했다고 하겠습니다. 총 10번을 던져 기록한 데이터는 다음과 같습니다:
이 데이터를 바탕으로 사후 분포를 계산하기 위해 필요한 단계는 다음과 같습니다.
단계 1: 사전 분포 설정
사전 분포는 베타 분포로 설정합니다. 예를 들어,
단계 2: 우도 계산
우도는 베르누이 분포로 설정합니다. 주어진 데이터에서 성공(1)의 횟수
실패 횟수는
단계 3: 사후 분포 계산
사후 분포는 사전 분포와 우도를 결합하여 계산합니다. 사후 분포는 다음과 같이 베타 분포가 됩니다:
여기서:
따라서, 사후 분포는 다음과 같습니다:
결과
주어진 데이터에 기반한 사후 분포는
