AI 개념/기계학습, 심층학습

불확실성(Uncertainty)란 무엇일까?

AIstarter 2024. 2. 29. 16:28

오늘은 불확실성(Uncertainty)가 무엇인지 간단하게 다루어보고자 합니다. 

불확실성의 정의와 필요성을 간단히 다루고, 불확실성 유형에는 무엇이 있는지 함께 나누고자 합니다.


[불확실성의 정의와 필요성]

최신 딥러닝 모델들은 더 큰 모델을 더 많은 데이터로 학습을 진행하고 있습니다. 하지만 모델이 커질수록 해석하기가 어려우며, 해석하기 어려운 딥러닝 모델의 출력값을 얼마나 신뢰할 수 있을까요?

딥러닝의 신뢰의 문제는 요즘 자율주행, 헬스케어 등의 여러 분야에서 AI의 잘못된 판단이 결과에 큰 영향을 줄 수 있는 영역에서 중요하게 여겨지고 있습니다. 

 

불확실성은 이러한 신뢰의 문제를 해결하는데 주요한 KEY POINT로 떠오르고 있습니다.

 

불확실성(Uncertainty)은 완전하지 않거나 알 수 없는 정보를 수반하는 상황을 말합니다.

 

또한 최근 딥러닝에서는 Uncertainty로 인해 정확한 예측하지 못하는 경우 빈번하게 발생하고 있는데,

 

이때 over-confidence라는 문제가 발생할 수 있습니다. 이는 주어진 정보 밖의 데이터가 주어지면 모른다고 답하는 것이 아니라 틀린 답을 제출하는 오류로 AI의 과잉 확신(overconfidence)이라고 합니다. 학습에 대한 답이 없는데도 Uncertainty를 인지하지 못하고 문제 발생하는 경우를 over-confidence 문제가 발생할 수 있습니다.

 

이러한 문제가 발생하지 않기 위해서 딥러닝 시스템을 구축할 때,
딥러닝의 불확실성 (Uncertainty)를 고려할 수 있는 시스템을 만드는 것이 중요합니다.


[Uncertainty 유형]

 

불확실성의 유형은 크게 3가지로, (1) out of distribution (2) aleatoric (3) epistemic uncertainty 로 나뉩니다.

 

 

(1) Out of distribution test data 유형

해당 유형은 한번도 학습할 때 사용하지 못한 유형의 데이터가 테스트로 사용되는 경우입니다.

예를 들어, 여러 개의 개 품종 사진으로 훈련된 모델이 주어졌을 때 ,모델에게 고양이 사진을 사용하여 개 품종을 결정하도록 요청하는 경우 이 유형에 해당됩니다.

 

(2) aleatoric 유형

해당 유형은 학습 데이터 자체에 노이즈가 많아져서 불확실성이 생기는 경우입니다.

위의 그림의 고양이 이미지를 보시면 노이즈가 많아서 해당 이미지를 인식하기 어렵다고 느낄 것입니다.
이처럼 노이즈로 이미지가 blurry하게 보이는 것과 같은 상황이 학습시 포함되면 불확실성이 생긴다고 말할 수 있습니다.

 

(3) epistemic uncertainty

해당 유형은 주어진 데이터 세트를 가장 잘 설명하는 최상의 모델 매개변수 및 모델 구조가 무엇인지 알 수 없는 상황일 때 발생하는 불확실성입니다.

위의 사진과 같이 3가지의 그래프가 주어졌는데, 어떤 그래프를 사용해야할지 알 수 없는 경우와 같은 예시를 생각할 수 있습니다.

 


 

딥러닝 시스템을 구축할 때, 불확실성을 고려하는 것이 점점 중요하게 다루어지고 있으며, 불확실성을 추정하기 위한 방법과 불확실성을 이용한 여러 연구가 현재 이루어지고 있습니다. 

 

여러 연구와 관련해서는 저도 공부중에 있습니다. 궁금한 점이나 함께 다루어봤으면 하는 연구가 있다면, 언제든지 댓글로 남겨주세요:)