{rfName}
Dy

APC

1 973,00 Euros
Springer
Transformative agreement with library

Licencia y uso

Icono OpenAccess

Citaciones

8

Altmetrics

Investigadores/as Institucionales

Guillen-Pacho, IbaiAutor (correspondencia)Badenes-Olmedo, CarlosAutor o CoautorCorcho, OscarAutor o Coautor

Compartir

25 de agosto de 2024
Publicaciones
>
Artículo

Dynamic topic modelling for exploring the scientific literature on coronavirus: an unsupervised labelling technique

Publicado en: International Journal of Data Science and Analytics. 20 (3): 2551-2581 - 2025-09-01 20(3), DOI: 10.1007/s41060-024-00610-0

Autores:

Guillén-Pacho, I; Badenes-Olmedo, C; Corcho, O
[+]

Afiliaciones

Univ Politecn Madrid, Comp Sci Dept, Madrid, Spain - Autor o Coautor
Univ Politecn Madrid, Ontol Engn Grp, Madrid, Spain - Autor o Coautor

Resumen

The work presented in this article focusses on improving the interpretability of probabilistic topic models created from a large collection of scientific documents that evolve over time. Several time-dependent approaches based on topic models were compared to analyse the annual evolution of latent concepts in the CORD-19 corpus: Dynamic Topic Model, Dynamic Embedded Topic Model, and BERTopic. Then COVID-19 period (December 2019-present) has been analysed in greater depth, month by month, to explore the evolution of what is written about the disease. The evaluations suggest that the Dynamic Topic Model is the best choice to analyse the CORD-19 corpus. A novel topic labelling strategy is proposed for dynamic topic models to analyse the evolution of latent concepts. It incorporates content changes in both the annual evolution of the corpus and the monthly evolution of the COVID-19 disease. The generated labels are manually validated using two approaches: through the most relevant documents on the topic and through the documents that share the most semantically similar label topics. The labelling enables the interpretation of topics. The novel method for dynamic topic labelling fits the content of each topic and supports the semantics of the topics.
[+]

Palabras clave

Cord-1Cord-19CoronavirusCoronavirusesCovid-19Dynamic topic modelDynamic topic modelsInterpretabilityLabeling techniquesLabelingsScientific literatureStem-cell transplantationTimTopic interpretabilityTopic labelingTopic labellingTopic modeling

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista International Journal of Data Science and Analytics debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2025, se encontraba en la posición 128/258, consiguiendo con ello situarse como revista Q2 (Segundo Cuartil), en la categoría Computer Science, Information Systems. Destacable, igualmente, el hecho de que la Revista está posicionada en el Cuartil Q2 para la agencia Scopus (SJR) en la categoría Modeling and Simulation.

Independientemente del impacto esperado determinado por el canal de difusión, es importante destacar el impacto real observado de la propia aportación.

Según las diferentes agencias de indexación, el número de citas acumuladas por esta publicación hasta la fecha 2026-04-26:

  • WoS: 2
[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-26:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 24 (PlumX).

Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

  • El trabajo se ha enviado a una revista cuya política editorial permite la publicación en abierto Open Access.
  • Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://oa.upm.es/88044/

Como resultado de la publicación del trabajo en el repositorio institucional, se han obtenido datos estadísticos de uso que reflejan su impacto. En términos de difusión, podemos afirmar que, hasta la fecha

  • Visualizaciones: 135
  • Descargas: 14
[+]

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (GUILLÉN PACHO, IBAI) y Último Autor (CORCHO GARCIA, OSCAR).

el autor responsable de establecer las labores de correspondencia ha sido GUILLÉN PACHO, IBAI.

[+]

Reconocimientos ligados al ítem

Open Access funding provided thanks to the CRUE-CSIC agreement with Springer Nature. This work is supported by the DRUGS4COVID++ project, funded by Ayudas Fundacion BBVA a equipos de investigacion cientifica SARS-CoV-2 y COVID-19; and by the Predoctoral Grant (PIPF-2022/COM-25947) of the Consejeria de Educacion, Ciencia y Universidades de la Comunidad de Madrid, Spain.
[+]