{rfName}
Tr

APC

2 860,00 Euros

Licencia y uso

Icono OpenAccess

Altmetrics

Investigadores/as Institucionales

Solarte-Pabón OAutor (correspondencia)Garcia-Barragan AAutor o CoautorMenasalvas EAutor o CoautorRobles VAutor o Coautor

Compartir

14 de agosto de 2023
Publicaciones
>
Artículo

Transformers for extracting breast cancer information from Spanish clinical narratives

Publicado en: ARTIFICIAL INTELLIGENCE IN MEDICINE. 143 102625- - 2023-09-01 143(), DOI: 10.1016/j.artmed.2023.102625

Autores:

Solarte-Pabón, O; Montenegro, O; García-Barragán, A; Torrente, M; Provencio, M; Menasalvas, E; Robles, V
[+]

Afiliaciones

Centro De Tecnologia Biomedica - Autor o Coautor
Centro de Tecnología Biomédica , Universidad del Valle, Cali - Autor o Coautor
Hosp Univ Puerta Hierro Madrid, Madrid, Spain - Autor o Coautor
Hospital Universitario Puerta de Hierro Majadahonda - Autor o Coautor
Univ Politecn Madrid, Ctr Tecnol Biomed, Madrid, Spain - Autor o Coautor
Univ Valle, Escuela Ingn Sistemas, Cali, Colombia - Autor o Coautor
Universidad del Valle, Cali - Autor o Coautor
Ver más

Resumen

The wide adoption of electronic health records (EHRs) offers immense potential as a source of support for clinical research. However, previous studies focused on extracting only a limited set of medical concepts to support information extraction in the cancer domain for the Spanish language. Building on the success of deep learning for processing natural language texts, this paper proposes a transformer-based approach to extract named entities from breast cancer clinical notes written in Spanish and compares several language models. To facilitate this approach, a schema for annotating clinical notes with breast cancer concepts is presented, and a corpus for breast cancer is developed. Results indicate that both BERT-based and RoBERTa-based language models demonstrate competitive performance in clinical Named Entity Recognition (NER). Specifically, BETO and multilingual BERT achieve F-scores of 93.71% and 94.63%, respectively. Additionally, RoBERTa Biomedical attains an F-score of 95.01%, while RoBERTa BNE achieves an F-score of 94.54%. The findings suggest that transformers can feasibly extract information in the clinical domain in the Spanish language, with the use of models trained on biomedical texts contributing to enhanced results. The proposed approach takes advantage of transfer learning techniques by fine-tuning language models to automatically represent text features and avoiding the time-consuming feature engineering process.
[+]

Palabras clave

breast cancerclassificationclinical narrativesdeep learningdocumentationnamed entity recognition (ner)oncologyrecognitionrecordsstageBreast cancerBreast neoplasmsClinical narrativesDeep learningElectronic health recordsInformation storage and retrievalMultilingualismNamed entity recognition (ner)Natural language processingNatural language processing (nlp)Pathology reports

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista ARTIFICIAL INTELLIGENCE IN MEDICINE debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2023, se encontraba en la posición 4/44, consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Medical Informatics. Destacable, igualmente, el hecho de que la Revista está posicionada por encima del Percentil 90.

Desde una perspectiva relativa, y atendiendo al indicador del impacto normalizado calculado a partir de las Citas Mundiales proporcionadas por WoS (ESI, Clarivate), arroja un valor para la normalización de citas relativas a la tasa de citación esperada de: 3.31. Esto indica que, de manera comparada con trabajos en la misma disciplina y en el mismo año de publicación, lo ubica como trabajo citado por encima de la media. (fuente consultada: ESI 13 Nov 2025)

Esta información viene reforzada por otros indicadores del mismo tipo, que aunque dinámicos en el tiempo y dependientes del conjunto de citaciones medias mundiales en el momento de su cálculo, coinciden en posicionar en algún momento al trabajo, entre el 50% más citados dentro de su temática:

  • Media Ponderada del Impacto Normalizado de la agencia Scopus: 2.48 (fuente consultada: FECYT Mar 2025)

De manera concreta y atendiendo a las diferentes agencias de indexación, el trabajo ha acumulado, hasta la fecha 2026-04-27, el siguiente número de citas:

  • WoS: 17
  • Scopus: 25
  • Google Scholar: 14
[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-27:

  • El uso, desde el ámbito académico evidenciado por el indicador de la agencia Altmetric referido como agregaciones realizadas por el gestor bibliográfico personal Mendeley, nos da un total de: 80.
  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 79 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

  • El Score total de Altmetric: 8.
  • El número de menciones en medios de comunicación: 1 (Altmetric).

Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

  • El trabajo se ha enviado a una revista cuya política editorial permite la publicación en abierto Open Access.
  • Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://oa.upm.es/81544/

Como resultado de la publicación del trabajo en el repositorio institucional, se han obtenido datos estadísticos de uso que reflejan su impacto. En términos de difusión, podemos afirmar que, hasta la fecha

  • Visualizaciones: 265
  • Descargas: 172
[+]

Análisis de liderazgo de los autores institucionales

Este trabajo se ha realizado con colaboración internacional, concretamente con investigadores de: Colombia.

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (SOLARTE PABÓN, OSWALDO) y Último Autor (ROBLES FORCADA, VICTOR).

el autor responsable de establecer las labores de correspondencia ha sido SOLARTE PABÓN, OSWALDO.

[+]