{rfName}
Ar

Licencia y uso

Icono OpenAccess

Altmetrics

Investigadores/as Institucionales

Conti, GAutor o CoautorSerrano-Olmedo, JjAutor o CoautorCasanova-Carvajal, OAutor (correspondencia)

Compartir

1 de enero de 2026
Publicaciones
>
Artículo

Artificial Intelligence Pipeline for Mammography-Based Breast Cancer Detection: An Integrated Systematic Review and Large-Scale Experimental Validation

Publicado en: Medicina-Lithuania. 61 (12): 2237- - 2025-12-18 61(12), DOI: 10.3390/medicina61122237

Autores:

Anez, Daniel; Conti, Giuseppe; Uriarte, Juan Jose; Serrano-Olmedo, Jose-Javier; Martinez-Murillo, Ricardo; Casanova-Carvajal, Oscar
[+]

Afiliaciones

CSIC, Inst Cajal, Dept Translat Neurosci, Neurovasc Res Grp - Autor o Coautor
Inst Salud Carlos III, Ctr Invest Biomed Red Bioingn Biomat & Nanomed - Autor o Coautor
Univ Antonio Nebrija, Escuela Politecn Super, ARIES Res Ctr - Autor o Coautor
Univ Int Empresa UNIE, Escuela Super Ingn Ciencia & Tecnol - Autor o Coautor
Univ Politecn Madrid, Ctr Tecnol Biomed, Campus Montegancedo - Autor o Coautor
Univ Politecn Madrid, Informat Proc & Telecommun Ctr IP&T Ctr - Autor o Coautor
Ver más

Resumen

Background and Objectives: Breast cancer remains a leading cause of cancer-related morbidity and mortality worldwide, and robust, interpretable artificial intelligence (AI) pipelines are increasingly being explored to support mammography-based detection. This study combines a PRISMA 2020-compliant systematic review with an original experimental validation to characterize current evidence and address identified gaps in reproducibility and interpretability. Materials and Methods: A PRISMA 2020-guided systematic review and an original experimental study were conducted. The review searched PubMed and Scopus/ScienceDirect for studies using convolutional neural networks (CNNs), support vector machines (SVMs) or eXtreme Gradient Boosting (XGBoost) for breast cancer detection in mammography and related imaging modalities, and identified 45 eligible articles. In parallel, we implemented and evaluated representative CNN (ResNet-50, EfficientNetB0 and MobileNetV3-Small) and classical machine learning (SVM and XGBoost) pipelines on the CBIS-DDSM dataset, following a CRISP-DM-inspired workflow and using Grad-CAM and SHAP to provide image- and feature-level explanations within a reproducible machine-learning-operations (MLOps)-oriented framework. Results: The systematic review revealed substantial heterogeneity in datasets, preprocessing pipelines, and validation strategies, with a predominant reliance on internal validation and limited use of explainable AI methods. In our experimental evaluation, ResNet-50 achieved the best performance (AUC-ROC 0.95; sensitivity 89%), followed by XGBoost (AUC-ROC 0.90; sensitivity 74%) and SVM (AUC-ROC 0.84; sensitivity 66%), while EfficientNetB0 and MobileNetV3-Small showed lower discrimination. Grad-CAM produced qualitatively plausible heatmaps centered on annotated lesions, and SHAP analyses indicated that simple global image-intensity and size descriptors dominated the predictions of the classical models. Conclusions: By integrating systematic evidence and large-scale experiments on CBIS-DDSM, this study highlights both the potential and the limitations of current AI pipelines for mammography-based breast cancer detection, underscoring the need for more standardized preprocessing, rigorous external validation, and routine use of explainable AI before clinical deployment.
[+]

Palabras clave

Artificial intelligenceBreast cancerBreast neoplasmsClassification modelsComputer-assisted diagnostic systemsConvolutional neural networksDeep learningFemaleHumansMachine learningMammographyNeural networks, computerReproducibility of resultsSupport vector machineSupport vector machines

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista Medicina-Lithuania debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2025, se encontraba en la posición 78/332, consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Medicine, General & Internal.

[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-24:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 11 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

    Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

    • El trabajo se ha enviado a una revista cuya política editorial permite la publicación en abierto Open Access.
    • Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://oa.upm.es/92468/

    Como resultado de la publicación del trabajo en el repositorio institucional, se han obtenido datos estadísticos de uso que reflejan su impacto. En términos de difusión, podemos afirmar que, hasta la fecha

    • Visualizaciones: 53
    • Descargas: 16
    [+]

    Análisis de liderazgo de los autores institucionales

    Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Último Autor (CASANOVA CARVAJAL, OSCAR ERNESTO).

    el autor responsable de establecer las labores de correspondencia ha sido CASANOVA CARVAJAL, OSCAR ERNESTO.

    [+]

    Objetivos del proyecto

    Los objetivos perseguidos en esta aportación se centran en avanzar el conocimiento sobre la detección de cáncer de mama mediante inteligencia artificial aplicada a mamografías. Se pretende analizar sistemáticamente la literatura existente conforme a PRISMA 2020 para caracterizar la evidencia actual y detectar brechas en reproducibilidad e interpretabilidad. Asimismo, se busca evaluar experimentalmente el rendimiento de modelos representativos de redes neuronales convolucionales (ResNet-50, EfficientNetB0, MobileNetV3-Small) y métodos clásicos (SVM, XGBoost) en el conjunto de datos CBIS-DDSM. Otro objetivo es proporcionar explicaciones a nivel de imagen y características mediante Grad-CAM y SHAP en un marco reproducible orientado a MLOps. Finalmente, se aspira a identificar limitaciones y necesidades para la estandarización, validación externa rigurosa y uso habitual de IA explicable antes de su implementación clínica.
    [+]

    Resultados más relevantes

    Los resultados más relevantes de esta aportación incluyen: la revisión sistemática identificó 45 estudios con alta heterogeneidad en conjuntos de datos, preprocesamiento y validación, predominando la validación interna y escaso uso de métodos explicables; en la validación experimental, ResNet-50 alcanzó un AUC-ROC de 0.95 y sensibilidad del 89%, seguido por XGBoost con AUC-ROC 0.90 y sensibilidad 74%, y SVM con AUC-ROC 0.84 y sensibilidad 66%, mientras EfficientNetB0 y MobileNetV3-Small mostraron menor discriminación; Grad-CAM generó mapas de calor plausibles centrados en lesiones anotadas; y SHAP reveló que descriptores globales de intensidad y tamaño dominaron las predicciones de modelos clásicos.
    [+]

    Narrativa contextual

    En este trabajo, presento una contribución integral al campo de la detección del cáncer de mama mediante inteligencia artificial, combinando una revisión sistemática rigurosa siguiendo las directrices PRISMA 2020 con una validación experimental a gran escala. Nuestro estudio analiza en profundidad 45 trabajos que aplican modelos como CNN, SVM y XGBoost a la mamografía y otras modalidades de imagen, identificando limitaciones persistentes en reproducibilidad e interpretabilidad dentro del estado del arte. Este enfoque dual permite no solo sintetizar el conocimiento existente, sino también contrastarlo con resultados propios bajo un marco experimental sólido, proporcionando una visión completa y fundamentada de las capacidades reales de la IA en este ámbito. 

    Como director del estudio y último firmante, he guiado la visión conceptual, el diseño metodológico y la supervisión científica global del proyecto, asegurando la coherencia entre la revisión crítica y el aporte experimental. Este rol ha sido clave para articular un pipeline de IA robusto, interpretable y orientado a la práctica clínica, en un contexto en el que la comunidad internacional enfatiza cada vez más la necesidad de sistemas confiables que complementen las limitaciones actuales del cribado mamográfico y la escasez de radiólogos. Con esta publicación, consolidamos una referencia metodológica y aplicada que impulsa el desarrollo de herramientas más transparentes y eficaces para la detección precoz del cáncer de mama.

    [+]