수학/통계학

확률(경우의수, 순열,조합,중복순열,중복조합)+확률변수(시행,사건,확률변수, 확률함수)

윤채니챈 2023. 6. 8. 16:45
728x90
반응형

 

확률 : 하나의 사건이 일어날 수 있는 가능성

-  일반적으로 0부터 1 사이의 값을 가지며, 0은 해당 사건이 발생하지 않을 확률을 의미, 1은 해당 사건이 반드시 발생할 확률을 의미

 

확률이 사용되는 예시

- 스팸 메일 분류모델을 만들고 새롭게 하나의 메일이 도착했을때, 그것이 스팸메일일 확률은?

 

s를 전체사전의 집합이라고 가정

사건 x가 일얼날 확률 = P(X)

 

P(X) = 사건 x가 일어나는 경우의 수 / 전체 경우의수 = n(x)/n(s)

 

앞면에1, 뒷면에 0이 쓰여있는 2개의 동전을 2번 던졌을때, 눈금의 합이 1일 확률은?

S = {(0,0),(0,1),(1,0),(1,1)}

X = {(0,1),(1,0)}

n(X)/n(S) = 2/4 =1/2 =0/5

 

 

통계적 확률: 반복적인 실험에서 특정한 사건이 발생하는 비율을 의미

시행한 데이터가 많다면 실제 확률에 근접 할 수 있다 -> 프로그램을 활용항여 통계적 확률을 계산 할 수 있다.

 


경우의수: 순열과 조합을 활용

 

순열 : 서로다른 n개에서 r개를 중복없이 뽑아 특정한 순서대로 나열하는 것

1) 순열의 수 공식(n=r일때)

nPn=n!(nn)!=n!0!=n!_{n}P_{n} = \frac{n!}{(n-n)!} = \frac{n!}{0!} = n!

2) 순열의 수 공식 (n≠r)일때

nPr=n!(nr)!_{n}P_{r} = \frac{n!}{(n-r)!}

 

더보기

기계 학습 모델을 학습하기 위해 N개의 데이터로 학습을 진행

epoch모델에 학습데이터를 넣은 순서를 섞어(shuffiling)학습을 진행

에포크(epoch)란? 학습데이터 세트에 포함된 모든 데이터가 한번씩 모델을 통과하는 횟수

 

  • 파이썬이용한 순열 계산
from itertools import permutations

# 원하는 리스트를 생성합니다.
my_list = [1, 2, 3]

# 리스트의 순열을 생성합니다.
#원소중에서 2개를 뽑는 모든 순열을 계산한다.
permutations_list = list(permutations(my_list),2)
print(permutations_lis)

 


조합: 서로다른 n개에서 r개를 중복없이 순서를 고려하지않고 뽑는 것 의미

 

nCr=n!r!(nr)!_{n}C_{r} = \frac{n!}{r!(n-r)!}

 

  • 파이썬이용한 조합계산
from itertools import combinations

# 원하는 리스트를 생성합니다.
my_list = [1, 2, 3, 4]

# 리스트에서 길이 2의 모든 조합을 생성합니다.
combinations_list = list(combinations(my_list, 2))
print(combinations_list)

중복순열 : 서로 다른 n개에서 중복을 포함해 r개를 뽑아 특정한 순서로 나열하는 것을 의미

 

nΠr=nr_{n}\Pi_{r} = n^r

예를 들어, 4개의 숫자 1, 2, 3, 4로 세 자리의 수를 만드는 경우의 수는 다음과 같다.

이 때, 가능한 중복순열은 다음과 같다

111, 112, 113, 114, 121, 122, 123, 124, ...

 

  • 파이썬이용한 중복순열
from itertools import product

# 원하는 요소들의 리스트와 중복 횟수를 설정합니다.
my_list = [1, 2, 3]
repeat = 2  # 중복 횟수

# 중복 순열을 생성합니다.
permutations_list = list(product(my_list, repeat=repeat))

print(permutations_list)

 


 

중복조합 : 서로 다른 n개에서 중복을 포함해 순서를 고려하지 않고 r개를 뽑는 것 의미

 

nHr=n+r1Cr=(n+r1)!r!(n1)!_{n}H_{r} = _{n+r-1}C_{r} = \frac{(n+r-1)!}{r!(n-1)!}

 

  • 파이썬이용한 중복조합
from itertools import combinations_with_replacement

# 원하는 요소들의 리스트와 조합 길이를 설정합니다.
my_list = [1, 2, 3]
combination_length = 2

# 중복 조합을 생성합니다.
combinations_list = list(combinations_with_replacement(my_list, combination_length))
print(combinations_list)

시행 : 반복할수 있으며, 매번 결과가 달라질 수 있는 실험 ex) 주사위를 2개 던지는 행동

사건: 시행에 따른 결과를 의미 ex)눈금의 합이 7이 되는사건

확률 -> 어떤 사건이 일어날 가능성을 수로 표현한것 

 

확률변수: 사건으로 인해 그 값이 확률적으로 정해지는 변수 

표본공간: 가능한 모든 결과의 집합

상태공간(=x) : 확률변수가 취할수 있는 모든 x의 집합의미

주사위를 던지기 -> 확률실험

1부터 6까지의 정수(표본공간)  중 하나의 값이 결정 (= x)

주사위의 눈을 나타내는 실수 함수로 표현(확률변수) (= X)

 

확률함수 : 확률 변수에 따라 확률값을 부여하는 함수 (=p)

ex) 주사위를 두개 던지기(시행)할때 눈금의 합이 3이 나올 확률 = 1/36

p(X=3) = 1/36

 

확률변수 예시

 

앞면에 1, 뒷면에 0이 쓰여있는 2개의 동전있음

 

시행 :  동전 2개를 동시에 던지기

표본공간 : {(0,0),(0,1),(1,0),(1,1)}

확률변수 X : 두눈금의 합

이때 가능한 X의 값 x (상태공간) = {0,1,2}

시행할때마다 X값이 달라 질 수 있으므로, 확률적으로 변할 수 있다고 하여 X를 확률변수라고 한다.

 

확률함수 

 

  • 눈금의 합이 0인 사건이 발생할 확률 : P(X=0) =1/4
  • 눈금의 합이 1인 사건이 발생할 확률:  P(X=1) =1/2
  • 눈금의 합이 2인 사건이 발생할 확률: P(X=2) =1/4

 

  • 딥러닝 분야에서 사건이란? 

데이터 = 사건 -> 이미지 분류 모델을 학습 할때에는 다양한 이미지를 사용하느넫, 내가 수집하여 가지고있는 이미지를 사건으로 이해한다

이미지 분류모델에서 P(x)의 의미는??

존재하는 모든 이미지 중에서 이미지 x가 나올 확률을 의미한다

 

 

 


1. 이산 확률변수 (Discrete Random Variable): 

 - 이산 확률변수는 유한한 값을 가지거나 또는 셀 수 있는 값들 중 하나를 가질 수 있는 확률변수

 - 예를 들어, 동전 던지기에서 앞면의 개수, 주사위 던지기에서 나오는 눈의 값 등이 이산 확률변수의 예

 - 이산 확률변수의 확률 분포는 확률 질량 함수(probability mass function)로 표현

 - 예를 들어, 공정한 주사위의 눈을 나타내는 확률변수 X의 확률질량함수 f(x)는 다음과 같습니다.

    * f(x) = 1/6 (x = 1, 2, 3, 4, 5, 6)


2. 연속 확률변수 (Continuous Random Variable)

 - 연속 확률변수는 연속적인 값을 가지는 확률변수 실수 범위 내의 어떤 값을 가질 수 있음

 - 예를 들어, 사람의 키, 온도, 시간 등이 연속 확률변수의 예

 - 연속 확률변수의 확률 분포는 확률 밀도 함수(probability density function)로 표현

 - 확률밀도함수란 확률변수가 특정한 구간에 속할 확률을 나타내는 함수

 - 예를 들어, 평균이 μ이고 표준편차가 σ인 정규분포를 따르는 연속확률변수 Y의 확률밀도함수 f(y)는 다음과 같습니다.
 * f(y) = (1 / √(2πσ^2)) * exp(-(y - μ)^2 / (2σ^2))

 

 

조건부 확률  : 특정 사전 사건이 일어났을 때 사후 사건이 일어나는 확률을 의미조건부확률은 P(A|B)로 표기되며, "B가 주어졌을 때 A의 확률"이라고 읽을 수 있음 .  여기서 A와 B는 각각 사건을 나타내며, P(A|B)는 사건 B가 발생했을 때 사건 A가 발생할 확률을 나타냄

 

 

결합확률 : 두 개 이상의 사건이 동시에 발생할 확률을 의미 - 결합확률은 P(A∩B)로 표기되며, "A와 B가 동시에 발생할 확률"이라고 읽음    여기서 ∩ 기호는 교집합을 나타내며, 동시에 발생하는 사건들의 공통된 부분을 나타냄

 

조건부확률과 결합확률은 아래와 같은 관계

P(A∩B) = P(A|B) * P(B)

 

확률의독립 : 확률의 독립은 두 개 이상의 사건이 서로 영향을 주지 않고 독립적으로 발생하는 상황을 의미

즉, 하나의 사건이 발생하더라도 다른 사건의 발생 확률에는 아무런 영향을 주지 않는 것을 독립이라고 함.

두 개의 사건 A와 B가 독립적이라면, 아래의 조건이 성립
P(A∩B) = P(A) * P(B)
- P(A)는 사건 A의 확률을, P(B)는 사건 B의 확률을 나타냄

- 즉, 두 사건의 교집합의 확률은 각 사건의 확률을 곱한 값과 같아야 함
-  동전 던지기를 예로들자면,  동전의 앞면이 나올 확률을 A라고 하고, 동전의 뒷면이 나올 확률을 B라고 한다. 앞면이 나올 확률과 뒷면이 나올 확률은 각각 0.5이다.
이때, 동전의 앞면이 나올 사건 A와 동전의 뒷면이 나올 사건 B는 서로 독립적이다.

앞면이 나올 확률이 0.5이고, 뒷면이 나올 확률도 0.5인데, 한 번 동전을 던지더라도 앞면이 나왔다고 해서 뒷면이 나올 확률에는 아무런 영향을 주지않는다.
- 두 사건이 독립적이라면 하나의 사건이 발생하더라도 다른 사건의 발생 확률에는 영향을 주지 않는다는 특징을 가짐

 

 

 

 

728x90
반응형