Título

Automated method to assist breast cancer diagnosis

Autor

Jonathan Hernandez Capistran

Colaborador

Jorge Martinez Carballido (Asesor de tesis)

Nivel de Acceso

Acceso Abierto

Resumen o descripción

Breast cancer is the top cause of deaths by cancer in women worldwide. Methods for early detection of breast cancer are of great help to improve prognosis of patients, providing less aggressive treatment, and better time/cost performance. Stage 0 of can-cer, also known as pre-cancer, is not palpable and is only detected by screening mam-mogram examination. Therefore, the detection of cancer in this stage is desirable. This stage is characterized by lesions, known as micro-calcifications (MCs), the first clini-cally observable lesions, indicating such disease. Their typical size is less or equal to 1 mm, that is why it is difficult to be detected by an expert. In recent years, different methods, for micro-calcification detection on mammograms (X-ray images from the breast), have been proposed; however, the issue is still open to reach acceptable levels of detection rate and false alarm rate, preventing its use as a pre-diagnostic tool.

This work analyzes and proposes a new and simple system for detection of MCs, based on the use of the two most used public mammogram data sets, MIAS and DDSM. We first, analyze how an expert detects MCs in an image and which are its distinctive characteristics; such as intensity values of the surrounding tissue and the prominent peak in a MC. Therefore, a classification according to their local surroundings: obvi-ous, subtle and clusters. Additionally, a new MC detection method based on (1) mor-phologic segmentation for detection of regions of interest (ROIs), (2) extraction of few and effective attributes from candidates to MCs, and (3) one classification stage with two different classifiers, k Nearest Neighbor (kNN) and Support Vector Machine (SVM). For dense mammograms in MIAS database with a sensitivity of 0.9752, false alarm rate of 0, accuracy of 0.9876, and 0.9951 for area under the ROC curve using SVM, for a classifier. The proposed MC detection method achieves sensitivity, false positive rate, accuracy and area under the ROC curve of 0.9664, 0.0224, 0.9683 and 0.9934 for the MIAS data set; and 0.9386, 0.0526, 0.9664 and 0.9742 for the DDSM data set. The proposed method gives better results than those from state-of-the-art literature, when the mammograms are classified in fatty, fatty-glandular, and dense. Methods, that report results for dense mammograms, have poor performance; however, the presented method shows the best performance for dense mammograms.

El cáncer de mama es la principal causa de muerte por cáncer en mujeres de todo el mundo. Los métodos para la detección temprana del cáncer de seno son de gran ayuda para mejorar el pronóstico de las pacientes, ya que proporcionan un tratamiento menos agresivo y un mejor desempeño en tiempo- costo. La etapa 0 del cáncer, también conocida como pre-cáncer, no es palpable y solo se detecta mediante un examen de ma-mografía. Por lo tanto, la detección de cáncer en esta etapa es deseable. Esta etapa se caracteriza por lesiones, conocidas como microcalcificaciones (MC), las primeras le-siones clínicamente observables, que indican dicha enfermedad. Su tamaño típico es menor o igual a 1 mm, por eso es difícil que un experto lo detecte. En los últimos años, se han propuesto diferentes métodos para la detección de microcalcificaciones en ma-mografías (imágenes de rayos X del seno); sin embargo, el problema aún está abierto para alcanzar niveles aceptables de tasa de detección y tasa de falsos positivos, evitando su uso como herramienta de diagnóstico previo. Este trabajo analiza y propone un sis-tema nuevo y sencillo para la detección de MC, basado en el uso de los dos conjuntos de datos de mamografías públicas más utilizados, MIAS y DDSM. Primero, analiza-mos cómo un experto detecta los MC en una imagen y cuáles son sus características distintivas; tales como los valores de intensidad del tejido circundante y el pico promi-nente en un MC. Por lo tanto, una clasificación de acuerdo con su entorno local: obvio, sutil y agrupaciones. Además, un nuevo método de detección de MC basado en (1) segmentación morfológica para la detección de regiones de interés (ROI), (2) extrac-ción de relevantes características de candidatos a MC, y (3) una etapa de clasificación con dos clasificadores kNN y SVM. Para mamografías densas en la base de datos MIAS con una sensibilidad de 0.9752, tasa de falsa alarma de 0, precisión de 0.9876 y 0.9951 para el área bajo la curva ROC usando SVM, como clasificador. El método de detección de MC propuesto logra sensibilidad, tasa de falsos positivos, precisión y área bajo la curva ROC de 0.9664, 0.0224, 0.9683 y 0.9934 para el conjunto de datos MIAS; y 0.9386, 0.0526, 0.9664 y 0.9742 para el conjunto de datos DDSM. El método pro-puesto ofrece mejores resultados que los de la literatura actual, cuando las mamografías se clasifican en grasosas, glandulares grasosas y densas. Los métodos, que informan resultados de mamografías densas, tienen bajo rend

Editor

Instituto Nacional de Astrofísica, Óptica y Electrónica.

Fecha de publicación

diciembre de 2019

Tipo de publicación

Tesis de doctorado

Versión de la publicación

Versión aceptada

Formato

application/pdf

Idioma

Inglés

Audiencia

Estudiantes

Investigadores

Público en general

Sugerencia de citación

Hernández Capistrán, J., (2019), Automated method to assist breast cancer diagnosis, Tesis de Doctorado, Instituto Nacional de Astrofísica, Óptica y Electrónica.

Repositorio Orígen

Repositorio Institucional del INAOE

Descargas

282

Comentarios



Necesitas iniciar sesión o registrarte para comentar.