Publicacions
>
Review

From vision to text: A comprehensive review of natural image captioning in medical and

Publicat a:Medical Image Analysis. 97 103264- - 2024-10-01 97(), DOI: 10.1016/j.media.2024.103264

Autors: Reale-Nosei, G; Amador-Domínguez, E; Serrano, E

Afiliacions

Resum

Natural Image Captioning (NIC) is an interdisciplinary research area that lies within the intersection of Computer Vision (CV) and Natural Language Processing (NLP). Several works have been presented on the subject, ranging from the early template-based approaches to the more recent deep learning-based methods. This paper conducts a survey in the area of NIC, especially focusing on its applications for Medical Image Captioning (MIC) and Diagnostic Captioning (DC) in the field of radiology. A review of the state-of-the-art is conducted summarizing key research works in NIC and DC to provide a wide overview on the subject. These works include existing NIC and MIC models, datasets, evaluation metrics, and previous reviews in the specialized literature. The revised work is thoroughly analyzed and discussed, highlighting the limitations of existing approaches and their potential implications in real clinical practice. Similarly, future potential research lines are outlined on the basis of the detected limitations.

Paraules clau

BenchmarkingClinical practiceComputer visionDeep learningDiagnosisDiagnostic captioningGenerationHumanImage captioningInterdisciplinary researchMedical image captioningMedical imagingMicrowave integrated circuitsModelsNatural image captioningNatural imagesNatural language processingNatural language processing systemsRadiologyRadiology report generationRadiology reportsReport generationReviewState-of-the art reviewsState-of-the-art reviewSurveyVision

Indicis de qualitat

Impacte bibliomètric. Anàlisi de la contribució i canal de difusió

El treball ha estat publicat a la revista Medical Image Analysis a causa de la seva progressió i el bon impacte que ha aconseguit en els últims anys, segons l'agència WoS (JCR), s'ha convertit en una referència en el seu camp. A l'any de publicació del treball, 2024 encara no hi ha indicis calculats, però el 2023, es trobava a la posició 6/123, aconseguint així situar-se com a revista Q1 (Primer Cuartil), en la categoria Computer Science, Artificial Intelligence. Destacable, igualment, el fet que la revista està posicionada per sobre del Percentil 90.

Independentment de l'impacte esperat determinat pel canal de difusió, és important destacar l'impacte real observat de la pròpia aportació.

Segons les diferents agències d'indexació, el nombre de citacions acumulades per aquesta publicació fins a la data 2025-06-02:

  • WoS: 4
  • Scopus: 8

Impacte i visibilitat social

Des de la dimensió d'influència o adopció social, i prenent com a base les mètriques associades a les mencions i interaccions proporcionades per agències especialitzades en el càlcul de les denominades "Mètriques Alternatives o Socials", podem destacar a data 2025-06-02:

  • L'ús d'aquesta aportació en marcadors, bifurcacions de codi, afegits a llistes de favorits per a una lectura recurrent, així com visualitzacions generals, indica que algú està fent servir la publicació com a base del seu treball actual. Això pot ser un indicador destacat de futures cites més formals i acadèmiques. Aquesta afirmació està avalada pel resultat de l'indicador "Capture", que aporta un total de: 60 (PlumX).

És fonamental presentar evidències que recolzin l'alineació plena amb els principis i directrius institucionals sobre Ciència Oberta i la Conservació i Difusió del Patrimoni Intel·lectual. Un clar exemple d'això és:

  • Assignació d'un Handle/URN com a identificador dins del Dipòsit en el Repositori Institucional: https://oa.upm.es/84575/

Com a resultat de la publicació del treball en el repositori institucional, s'han obtingut dades estadístiques d'ús que reflecteixen el seu impacte. En termes de difusió, podem afirmar que, fins a la data

  • Visualitzacions: 67
  • Descàrregues: 80

Anàlisi del lideratge dels autors institucionals

Hi ha un lideratge significatiu, ja que alguns dels autors pertanyents a la institució apareixen com a primer o últim signant, es pot apreciar en el detall: Primer Autor (Reale-Nosei, G) i Últim Autor (SERRANO FERNANDEZ, EMILIO).

l'autor responsable d'establir les tasques de correspondència ha estat AMADOR DOMINGUEZ, ELVIRA.