Ajou University repository

폐암 진단을 위한 딥러닝 모델과 데이터의 불확실성 분석 및 개선 기법
  • 최현진
Citations

SCOPUS

0

Citation Export

DC Field Value Language
dc.contributor.advisor이정원-
dc.contributor.author최현진-
dc.date.issued2024-08-
dc.identifier.other34080-
dc.identifier.urihttps://aurora.ajou.ac.kr/handle/2018.oak/39395-
dc.description학위논문(석사)--AI융합네트워크학과,2024. 8-
dc.description.abstract폐암은 사망률이 매우 높은 암 질환으로, 조기 발견 및 신속한 치료가 요구 된다. 따라서 건강검진 등을 통해 흉부 X-ray 영상을 촬영하였을 때 결절을 정확히 검출하고 진단하여 발생 초기의 암을 놓치지 않는 것이 중요하다. 하지만 흉부 X-ray에 대한 의사의 결절 진단 정확도는 경력 및 피로도에 따라 크게 달라져, 높은 정확도를 보장하기 어렵다. 이에 인공지능 분야에서는 딥러닝 기반 진단 모델의 개발이 진행되었고, 다수의 모델이 높은 성능을 보이고 있다. 하지만 의료 인공지능을 인지하고 있는 의사 중 인공지능 보조 도구의 실사용 비율은 10~30%로 여전히 매우 낮다. 이러한 임상 도입의 어려움은 딥러닝 모델과 데이터의 불확실성(Uncertainty)에 근거한다. 여기서 불확실성은 인공지능 분야에서의 개념을 칭하는 것으로, 데이터나 의사결정에 정보가 충분하지 않거나 모호한 상태를 의미한다. 모델 진단의 근거가 되는 흉부 X-ray 데이터 셋은 생성 및 수집 과정에서의 다양한 변인(예: 방사선사의 숙련도, 촬영 기기 의 사양, 촬영 환경 등)에 의해 불확실성을 가지며, 이를 학습하여 진단을 내리는 모델은 온전한 지식의 습득이 어렵기에 불확실성을 갖는다. 따라서 임상 현장으로의 도입률 향상을 위해서는, 모델 및 데이터 불확실성의 원인을 분석하고 개선해야 한다. 그러나 일반적인 영상의 변동성을 낮출 수 있는, 기존 전처리 방식으로써의 불확실성 처리 기법은 결절 내 세부 특징이 중요한 폐암 데이터셋에 적용되기에 적절치 않다. 또한 기존의 불확실성을 정량화하는 기법은 임상 현장에서 진단의 신뢰성을 제공할 수 있지만, 개선 기법을 통해 검증된다면 그 수치는 더욱 신뢰를 얻을 수 있다. 즉, 원본 의료 데이터에 대한 변형을 최소화하되 불확실성을 개선할 수 있는 기법의 개발이 요구된다. 이에 본 논문에서는 폐암 진단을 위한 딥러닝에 존재하는 데이터 및 모델 불확실성을 임상 현장 도입의 관점에서 분석하고, 개선 기법을 개발함에 반영되어야 할 요구사항을 도출하여, 이를 충족시킬 수 있는 기법을 제안한다. 제안하는 기법은 자체 보유한 흉부 X-ray 데이터셋 AH, 그리고 웹상에서 수집된 6개의 오픈 데이터셋에 대해 검증 실험을 수행하였다. 실험 결과 각각의 데이터 불확실성 개선 기법은 90% 이상의 민감도 및 특이도로 검증되었다. 또한, 제안하는 기법으로 개선된 데이터셋은 모델 학습 결과 검증 데이터에 대해 약 0.1%에서 최대 5%의 성능 향상을 이룸으로써 데이터 불확실성이 개선 되었음을 증명하였다. 분류 모델 불확실성 개선 기법은 폐암 진단 민감도를 약 12% 높였으며, 검출 모델 불확실성 개선 기법은 2 FPPI 일때 민감도 92%를 달성하며 기존 대비 약 10%가량의 성능 향상을 이루었다. 본 논문은 임상 현장 관점에서의 데이터 및 모델 불확실성에 근거한 개선 방안을 제시함으로써 의료 인공지능 모델의 불확실성 개선 가능성을 보였다. 제안된 데이터 불확실성 개선 기법은 폐암 데이터셋의 불확실성 개선 뿐만 아니라, 임상 화질 평가 기준을 갖는 타 의료 데이터에도 적용되어 유사한 프로세스를 구축할 수 있다. 또한, 제안하는 모델 불확실성 개선 기법은 모델 의존적이지 않아 폐암 진단 모델 개발 시 모델의 구조에 무관하게 적용될 수 있으며, 나아가 타 병변 진단 모델 개발 시에도 불확실성을 개선함에 활용될 수 있다.|Lung cancer has a very high death rate and requires early detection and rapid treatment. Therefore, when a Chest X-ray(CXR) image is taken, it is important not to miss the early stage cancer by accurately detecting and diagnosing the nodules. However, it is difficult to ensure high accuracy in the diagnosis of a doctor's CXR because it varies greatly depending on experience and fatigue. Accordingly, deep learning-based diagnostic models have been developed and many models are showing high performance. However, among doctors who are aware of the models, the actual use of them is still very low, at 10-30%. _x000D_ <br>This difficulty in clinical adoption is based on uncertainty of deep learning model and data. Here, uncertainty is a concept in the field of artificial intelligence(AI), that refers to a state where data or decision-making is insufficient or ambiguous. The CXR dataset, which is the basis for model diagnosis, has uncertainty due to various factors (e.g., the proficiency of the radiologist, the specifications of the imaging device, the imaging environment, etc.) in the process of creation and collection. And these uncertainties make difficult to learn complete knowledge for model. Therefore, in order to improve the adoption rate into the clinical field, the causes of model and data uncertainty should be analyzed and improved. _x000D_ <br>However, the pre-proposed techniques, that can reduce the variability of images within a dataset for uncertainty processing, are not suitable for lung cancer datasets because detailed features within the nodule are important. The uncertainty quantification method can - 84 - help determine the degree of trust in the clinical field, but it can be further trusted if verified through an improvement techniques. In other words, it is required to develop a technique that can improve uncertainty while minimizing alterations on the original medical data. Therefore, this paper analyzes the data and model uncertainties present in deep learning for lung cancer diagnosis from the perspective of clinical field introduction. And derives requirements to be reflected in developing improvement techniques, and proposes techniques that can satisfy them. _x000D_ <br>The proposed technique performed verification experiments on its own CXR dataset AH and six open datasets collected on the web. As a result of the experiment, each data uncertainty improvement technique was verified with a sensitivity and specificity of over 90%. In addition, the proposed dataset was proved to have improved data uncertainty by achieving a performance improvement of about 0.1% to up to 5% on verification data as a result of model training. The classification model uncertainty improvement technique increased the sensitivity to diagnose lung cancer by about 12%, and the detection model uncertainty improvement technique achieved a sensitivity of 92% in 2FPPI, achieving a performance improvement of about 10% compared to the previous one. _x000D_ <br>This paper showed the possibility of improving the uncertainty of medical artificial intelligence models by suggesting improvement measures based on data and model uncertainty from a clinical field perspective. In addition to improving the uncertainty of lung cancer datasets, the proposed data uncertainty improvement technique can be applied to other medical data with clinical quality evaluation criteria to - 85 - build similar processes. In addition, since the proposed model uncertainty improvement technique is not model-dependent, it can be applied irrespective of the structure of the model when developing a lung cancer diagnosis model. Furthermore, it can be used to improve uncertainty when developing other lesion diagnosis models.-
dc.description.tableofcontents1. 서론 1_x000D_ <br>2. 관련 연구 5_x000D_ <br> 2.1. 폐암 진단을 위한 딥러닝 기법 5_x000D_ <br> 2.2. 흉부 X-ray 데이터의 불확실성 처리 기법 6_x000D_ <br> 2.3. 폐암 진단 모델의 불확실성 처리 기법 7_x000D_ <br>3. 폐암 진단을 위한 딥러닝의 불확실성 분석 10_x000D_ <br> 3.1. 폐암 데이터셋의 불확실성 분석 10_x000D_ <br> 3.1.1. 폐암 데이터셋의 불확실성 분석 및 개선 요구사항 도출 10_x000D_ <br> 3.1.2. 폐암 데이터셋의 불확실성 개선 세부 요구사항 도출 13_x000D_ <br> 3.2. 폐암 진단 모델의 불확실성 분석 16_x000D_ <br> 3.2.1. 폐암 진단 모델의 불확실성 분석 및 개선 요구사항 도출 16_x000D_ <br> 3.2.2. 폐암 진단 모델의 불확실성 개선 세부 요구사항 도출 20_x000D_ <br>4. 폐암 진단을 위한 딥러닝의 불확실성 개선 기법 21_x000D_ <br> 4.1. 폐암 데이터셋의 불확실성 개선 기법 22_x000D_ <br> 4.2. 폐암 진단 모델의 불확실성 개선 기법 31_x000D_ <br> 4.2.1. 분류 모델의 불확실성 개선 기법 31_x000D_ <br> 4.2.2. 검출 모델의 불확실성 개선 기법 35_x000D_ <br>5. 실험 37_x000D_ <br> 5.1. 데이터셋 및 실험 환경 37_x000D_ <br> 5.2. 요구사항별 불확실성 개선 기법 검증 메트릭 38_x000D_ <br> 5.3. 폐암 데이터셋 불확실성 개선 검증 실험 39_x000D_ <br> 5.3.1. 폐암 데이터셋 불확실성 개선 기법의 성능 검증 실험 39_x000D_ <br> 5.3.2. 폐암 데이터셋 불확실성 개선 기법의 유효성 검증 실험 51_x000D_ <br> 5.4. 폐암 진단 모델 불확실성 개선 검증 실험 54_x000D_ <br> 5.4.1. 분류 모델 불확실성 개선 검증 실험 54_x000D_ <br> 5.4.2. 검출 모델 불확실성 개선 검증 실험 64_x000D_ <br>6. 결론 72_x000D_ <br>참고문헌 74-
dc.language.isokor-
dc.publisherThe Graduate School, Ajou University-
dc.rights아주대학교 논문은 저작권에 의해 보호받습니다.-
dc.title폐암 진단을 위한 딥러닝 모델과 데이터의 불확실성 분석 및 개선 기법-
dc.title.alternativeUncertainty Analysis and Improvement Method of Deep Learning Model and Data for Lung Cancer Diagnosis-
dc.typeThesis-
dc.contributor.affiliation아주대학교 대학원-
dc.contributor.alternativeNameHYEONJIN CHOI-
dc.contributor.department일반대학원 AI융합네트워크학과-
dc.date.awarded2024-08-
dc.description.degreeMaster-
dc.identifier.urlhttps://dcoll.ajou.ac.kr/dcollection/common/orgView/000000034080-
dc.subject.keyword딥러닝-
dc.subject.keyword불확실성 개선-
dc.subject.keyword폐암 진단-
dc.subject.keyword흉부 X-ray-
dc.description.alternativeAbstractLung cancer has a very high death rate and requires early detection and rapid treatment. Therefore, when a Chest X-ray(CXR) image is taken, it is important not to miss the early stage cancer by accurately detecting and diagnosing the nodules. However, it is difficult to ensure high accuracy in the diagnosis of a doctor's CXR because it varies greatly depending on experience and fatigue. Accordingly, deep learning-based diagnostic models have been developed and many models are showing high performance. However, among doctors who are aware of the models, the actual use of them is still very low, at 10-30%. _x000D_ <br>This difficulty in clinical adoption is based on uncertainty of deep learning model and data. Here, uncertainty is a concept in the field of artificial intelligence(AI), that refers to a state where data or decision-making is insufficient or ambiguous. The CXR dataset, which is the basis for model diagnosis, has uncertainty due to various factors (e.g., the proficiency of the radiologist, the specifications of the imaging device, the imaging environment, etc.) in the process of creation and collection. And these uncertainties make difficult to learn complete knowledge for model. Therefore, in order to improve the adoption rate into the clinical field, the causes of model and data uncertainty should be analyzed and improved. _x000D_ <br>However, the pre-proposed techniques, that can reduce the variability of images within a dataset for uncertainty processing, are not suitable for lung cancer datasets because detailed features within the nodule are important. The uncertainty quantification method can - 84 - help determine the degree of trust in the clinical field, but it can be further trusted if verified through an improvement techniques. In other words, it is required to develop a technique that can improve uncertainty while minimizing alterations on the original medical data. Therefore, this paper analyzes the data and model uncertainties present in deep learning for lung cancer diagnosis from the perspective of clinical field introduction. And derives requirements to be reflected in developing improvement techniques, and proposes techniques that can satisfy them. _x000D_ <br>The proposed technique performed verification experiments on its own CXR dataset AH and six open datasets collected on the web. As a result of the experiment, each data uncertainty improvement technique was verified with a sensitivity and specificity of over 90%. In addition, the proposed dataset was proved to have improved data uncertainty by achieving a performance improvement of about 0.1% to up to 5% on verification data as a result of model training. The classification model uncertainty improvement technique increased the sensitivity to diagnose lung cancer by about 12%, and the detection model uncertainty improvement technique achieved a sensitivity of 92% in 2FPPI, achieving a performance improvement of about 10% compared to the previous one. _x000D_ <br>This paper showed the possibility of improving the uncertainty of medical artificial intelligence models by suggesting improvement measures based on data and model uncertainty from a clinical field perspective. In addition to improving the uncertainty of lung cancer datasets, the proposed data uncertainty improvement technique can be applied to other medical data with clinical quality evaluation criteria to - 85 - build similar processes. In addition, since the proposed model uncertainty improvement technique is not model-dependent, it can be applied irrespective of the structure of the model when developing a lung cancer diagnosis model. Furthermore, it can be used to improve uncertainty when developing other lesion diagnosis models.-
Show simple item record

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Total Views & Downloads

File Download

  • There are no files associated with this item.