Klassifisering av histologiske bilder av tykk- og endetarmskreft ved hjelp av dyp læring
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3079753Utgivelsesdato
2023Metadata
Vis full innførselSamlinger
- Studentoppgaver (TN-IDE) [823]
Sammendrag
MSc-prosjekt innen biomedisinsk bildeanalyse av histologiske bilder av tykk- og endetarmskreft i samarbeid med Stavanger Universitetssykehus (SUS).
Tykk- og endetarmskreft er en av de vanligste kreftformene i Norge og forekomsten er økende. Ved krefttilfeller vil operasjonspreparatet (svulsten) vurderes av patolog for å fastslå alvorlighetsgraden som styrer videre behandling. For å lette arbeidsflyten til patologer er det mulig å utvikle maskinlæringsmodeller som kan gjenkjenne vevstyper og strukturer i digitaliserte histologiske bilder, referert til som whole slide bilder (WSI).
Denne masteroppgaven består av to delprosjekter; forbehandling og modellopplæring. Forbehandlingsdelen består av å manuelt avgrense svulsten fra normalt vev i hele whole slide bilder med et annoteringsverktøy. Algoritmen er utformet for å ta et helt WSI (.ndpi) med den tilsvarende XML-filen (.ndpa) og deretter returnere tiles innenfor den annoterte regionen av interesse (ROI). Ved å definere størrelsen og nivået på tilsene som skal trekkes ut, vil de bli samlet i separate mapper for hver vevstype. Disse mappene danner grunnlaget for datasettet som skal brukes til modellopplæring.
Dyplærings prosessen vil bruke det konstruerte datasettet til å trene en modell basert på maskinlæringsalgoritmer. Både binære- og multiklassifiseringsmodeller ble utført. Resultatene viste rom for forbedring med en samlet f1-score på 0.74 for den binære klassifiseringen og 0.38 for multiklassifiseringen. MSc project within biomedical image analysis of histological images of colorectal cancer in collaboration with Stavanger University hospital (SUS).
Colorectal cancer is one of the most common forms of cancer in Norway and the incidence is increasing. In cases of cancer, the surgical preparation (tumour) will be assessed by a pathologist to determine the degree of severity that governs further treatment. To facilitate the workflow of pathologists, it is possible to develop machine learning models that can recognize tissue types and structures in digitized histological images, referred to as whole slide images (WSI).
This master's thesis comprises two sub projects; pre-processing and model training. The pre-processing part consists of manually delineating the tumour from normal tissue in whole slide images with an annotation tool. The algorithm is designed to take a whole slide image (.ndpi) with the corresponding XML file (.ndpa) and then return tiles within the annotated region of interest (ROI). By defining the size and level of the tiles to to be extracted, they will be collected in separate folders for each tissue type. These folders forms the basis for the dataset that will be utilized for model training.
The training process will use the constructed dataset to train a model based on machine learning algorithms. Both binary and multi classification models were carried out. The results demonstrated room for improvement with an overall f1-score of 0.74 for the binary classification and 0.38 for the multi classification.