
베이지안과 AI
기술
인공지능이 다양한 산업 분야로 진출하고 있는 이 시점에, 우리는 인공지능이 도출한 결과를 얼마나 신뢰할 수 있나요? 실제로 현장에서는 종종 다음과 같은 질문과 마주합니다:
“데이터셋의 양을 늘려야 하는가?”
“신경망의 구조를 바꾸어야 하는가?”
“이 결과를 토대로 결정하기에는 너무 섣부르지 않을까?”
알고리즘 개발자들은 위 질문에 대한 답을 구하기 위해 광범위하게 노력하여 왔으며, ‘베이지안 학습’이라고 부르는 분야 또한 같은 맥락에서 탄생하게 되었습니다.
현재까지 대부분 산업에 적용된 모델들은 결정론적 함수를 바탕으로 한 것입니다. 따라서 비즈니스 의사 결정 단계에서 불확실성에 대한 정보를 구체적으로 제공하지 못하며, 다른 방식으로 이 상황을 해석할 수 밖에 없습니다.
심지어 인간의 생명을 위협할 가능성이 있는 상황에서 그 통제권을 AI가 갖게 되는 경우도 존재합니다. 예를 들면, 의료나 시스템 제어 분야에서 자동화된 진단, 의사 결정 및 추천 시스템이 작동하는 방식을 생각할 수 있습니다. 이 모든 경우에는 AI의 안전성이 필수적으로 담보되어야 하는 것입니다. MRI 스캐닝에 장착된 인공지능 시스템이 학습 과정에서는 한번도 관찰되지 않은 이미지에 대해 어떻게 판단을 내릴지, 자율 주행 자동차가 숙달되지 않은 새로운 경로를 주행할 경우 어떻게 작동할지 등 다양한 상황에서도 고려해 볼 일입니다.
따라서 산업에 적용되는 인공지능은 한번도 학습되지 못한 데이터를 입력받았거나 불확실성이 존재하는 경우 최소한 이를 사용자에게 알려주어야 할 것입니다. 저희는 불확실성에 대한 정확하고 높은 수준의 정보를 전달할 수 있도록 아래의 조건을 만족하는 모델을 개발하고 있습니다:
-
저희 모델은 측정의 부정확성을 감지할 수 있습니다. 잘못된 예측은 오염된 데이터나 레이블이 원인일 수 있습니다.
-
저희 모델은 파라미터의 불확실성에 대한 정보를 제공할 수 있습니다.
-
저희 모델은 구조의 불확실성에 대한 정보를 제공할 수 있습니다. 현업에서의 문제 해결을 위해서는 적절한 신경망 구조를 찾아야 합니다. 저희 모델은 주어진 신경망 구조가 가지는 불확실성이 얼마나 되는지 알려줄 수 있습니다.
응용 분야
AI 시대에 돌입하면서 점차적으로 기계 학습 모델이 주요 시스템의 통제권을 넘겨 받고 있습니다. 따라서 모델의 신뢰도를 논하기 위한 기술이 필요한 시점입니다.
의료 분야 - 진단
의사가 의료 기록 분석에 의거하여 환자에게 진단을 내리는 것은, 당연히 그 기록 분석을 수행한 전문가를 신뢰하고 있기 때문일 것입니다. 그런데 만약 MRI 스캐닝에 기반한 자동 암 검출 시스템과 같은 것이 도입된다면 신뢰성 문제는 더 이상 단순한 문제가 아닙니다. 자동화된 시스템 혹은 심지어 전문가들이 직접 판단을 내릴 때조차도 편견(혹은 정보의 편향성)의 영향을 받을 수 있습니다. 이는 결국 의사의 과잉 진단을 초래할 수 있습니다.
특정 테스트 결과가 분포에서 벗어난 예외적인 경우(학습 데이터에 나타나지 않은 경우)일 때, 시스템이 이를 인지하지 못하고 부적절한 결과를 도출할 수 있습니다. 이를 본 전문가 또한 부당한 편견을 받아들이게 될 지 모릅니다. 하지만 모델의 신뢰도 정보가 주어진다면 시스템이 무작위로 추측을 할 때마다 전문가는 이를 인지할 수 있습니다.
의료 분야 - 데이터 수집
오늘날 환자의 병력 데이터를 수집하는 것은 중요한 작업입니다. 그러므로 적절한 취득 전략을 마련하는 것이 중요한 문제입니다. 어떤 환자군이 다른 그룹에 비해 우선적으로 분류되어야 할까요? 이 질문에 대해 원칙적으로 대답할 수 있다면 의료 분야에서 효율적인 자원 배분이 가능할 것입니다.
