A metrological framework for uncertainty evaluation in machine learning classification models
Bilson, Cox, Pustogvar et al.
Machine learning (ML) classification models are increasingly being used in a wide range of applications where it is important that predictions are accompanied by uncertainties, including in climate and earth observation, medical diagnosis and bioaerosol monitoring. The output of an ML classification model is a type of categorical variable known as a nominal property in the International Vocabulary of Metrology (VIM). However, concepts related to uncertainty evaluation for nominal properties are not defined in the VIM, nor is such evaluation addressed by the Guide to the Expression of Uncertainty in Measurement (GUM). In this paper we propose a metrological conceptual uncertainty evaluation framework for nominal properties. This framework is based on probability mass functions and summary statistics thereof, and it is applicable to ML classification. We also illustrate its use in the context of two applications that exemplify the issues and have significant societal impact, namely, climate and earth observation and medical diagnosis. Our framework would enable an extension of the GUM to uncertainty for nominal properties, which would make both applicable to ML classification models.
기계학습 분류 모델은 기후 관측, 의료 진단, 생물 에어로졸 모니터링 등 중요한 응용 분야에서 점점 더 많이 사용되고 있으며, 이러한 응용 분야에서는 예측 결과에 불확실성 평가가 반드시 수반되어야 한다. ML 분류 모델의 출력은 국제계량학어휘(VIM)에서 명목 속성(nominal property)이라고 불리는 분류 변수이다. 그러나 VIM과 측정 불확실도 표현 지침(GUM) 모두 명목 속성의 불확실성 평가 개념을 정의하지 않고 있다. 본 논문은 확률질량함수(PMF) 및 그 요약 통계량을 기반으로 한 명목 속성의 계량학적 불확실성 평가 프레임워크를 제안하며, 이는 ML 분류에 적용 가능하다. 기후 관측과 의료 진단이라는 사회적 영향이 큰 두 가지 응용 사례를 통해 본 프레임워크의 사용을 설명한다. 본 프레임워크는 GUM이 명목 속성의 불확실성 평가로 확장되도록 하여, 양쪽 모두 ML 분류 모델에 적용 가능하게 만들 것이다.
논문은 86개의 참고문헌을 인용하며, 계량학 표준, 기계학습 이론, 불확실성 정량화 방법, 구체적인 응용 분야를 포함하여 본 연구에 견고한 이론적 기초와 광범위한 응용 배경을 제공한다. 주요 참고문헌에는 GUM 시리즈 문서, VIM 어휘, 베이지안 기계학습 방법, 불확실성 정량화 기술 등이 포함된다.