확률은 사건이 발생할 가능성을 수치로 표현한 것입니다. 일상 생활에서 우리는 종종 "비가 올 확률이 얼마나 될까?" 또는 "이번 로또에 당첨될 확률은 무엇일까?"와 같은 질문을 합니다. 이러한 질문에 답하기 위해 확률의 개념을 사용합니다. 데이터 분석에서 확률은 불확실성을 측정하고 예측을 하는 데 중요한 역할을 합니다.
독립 사건: 두 사건 A와 B가 있을 때, 한 사건의 발생이 다른 사건의 발생 확률에 영향을 주지 않는 경우, 이 두 사건을 독립 사건이라고 합니다. 독립 사건의 경우, 두 사건이 동시에 일어날 확률은 각 사건 발생 확률의 곱과 같습니다. 수학적으로 이를 표현하면, 사건 A와 B가 독립일 때,
*P*(*A*∩*B*)=*P*(*A*)×*P*(*B*)
종속 사건: 한 사건의 발생이 다른 사건의 발생 확률에 영향을 주는 경우입니다. 종속 사건에서는, 두 사건이 동시에 일어날 확률을 계산할 때, 한 사건이 다른 사건에 의존한다는 점을 고려해야 합니다. 종속 사건의 경우, 두 사건 A와 B가 동시에 일어날 확률은 다음과 같이 표현됩니다.
*P*(*A*∩*B*)=*P*(*A*)×*P*(*B*∣*A*) 또는 *P*(*A*∩*B*)=*P*(*B*)×*P*(*A*∣*B*)
데이터 분석에서 확률은 예측 모델을 만들거나 데이터 내의 불확실성을 평가하는 데 중요합니다. 예를 들어, 고객이 특정 제품을 구매할 확률을 계산함으로써 마케팅 전략을 개선할 수 있습니다.