Binary Cross Entropy

250x250

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

우잉's Development

Binary Cross Entropy 본문

Deep learning/용어 정리

Binary Cross Entropy

우잉이 2022. 1. 13. 17:54

728x90

1. Loss Function (손실함수)

: 머신러닝 혹은 딥러닝 모델의 출력값과 사용자가 원하는 값의 오차를 의미

- 정답( $y$ )와 예측 ( $\hat{y}$ )을 입력 받아 실숫값 점수를 만드는데, 이 점수가 높을수록 모델이 안좋습니다.

- 손실함수의 함수값이 최소화 되도록 하는 weight(가중치)와 편향(bias)를 찾는 것이 목표

2. 베르누이 분포

$f (Y = y_{i}; π) = π^{y} (1 - π)^{1 - y}$ , $y \in {0, 1}$

만약 $Y$ 가 1이면 $f = 1 - π$ 이고 $Y$ 가 0이면 $f = π$ 이다.

관측값 $y$ 를 고정시키고 위 함수를 parameter $π$ 에 대한 함수로 사용한다면 이는 베르누이분포에 대한 가능도 함수가 된다. $n$ 개의 관측데이터에 대해 가능도함수를 일반화 해보자.

$L (π | y) = \prod_{i = 1}^{n} f (y_{i} | π)$ , $y \in {0, 1}$ , $i = 1, . . ., n$

위의 식 베르누이 분포를 Loglikelihood function을 적용합니다.

여기서 Loglikelihood는 likelihood에 log함수를 취한 형태로 정의됩니다. log를 씌어줌으로써 확률의 거듭곱으로 발생할 수 있는 underflow를 방지합니다.

$l (π | y) = l o g (L (π | y))$

$= l o g (L (π | y))$

$= l o g (\prod_{i = 1}^{n} f (y_{i}; π))$

$= \sum_{i = 1}^{n} l o g (f (y_{i}; π))$

$= \sum_{i = 1}^{n} l o g (π_{i}^{y} (1 - π)^{1 - y_{i}})$

$= \sum_{i = 1}^{n} (y_{i} l o g (π) + (1 - y_{i}) l o g (1 - π))$

위의 과정으로 $L (π | y)$ 에 대한 loglikehood가 바로 Negative binary cross entropy의 형태인 것을 확인 할 수 있습니다.

3. Maximum Liklihood Estimation(MLE)

$a r g m a x_{π} L (π | y)$

Likelihood를 최대화 하는 $p i$ 는 또한 loglikelihood를 최대화 하므로, likelihood 대신 loglikelihood를 사용

$a r g m a x_{π} l (π | y)$

여기서 argmin으로 바꾸려면 위의 식에 -1을 곱해야 동일한 솔루션을 얻을 수 있습니다.

$a r g m i n_{π} - l (π | y)$

따라서

$a r g m a x_{π} - \sum_{i = 1}^{n} y_{i} l o g (π) + (1 - y_{i}) l o g (1 - π))$

를 얻을 수 있습니다. 이로써 binary cross entropy를 최소화 하였습니다.

4. Binary cross entropy

$B C E (x) = - \frac{1}{N} \sum_{i = 1}^{n} y_{i} l o g (f (x_{i}; π)) + (1 - y_{i}) l o g (1 - f (x_{i}; π))$

참고 : https://curt-park.github.io/2018-09-19/loss-cross-entropy/

728x90

'Deep learning > 용어 정리' 카테고리의 다른 글

Local minima (0)	2022.01.18
Cross-Entropy (0)	2022.01.14
Bilinear interpolation (0)	2022.01.12

'Deep learning/용어 정리' Related Articles

Comments

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

우잉's Development

우잉's Development