{rfName}
Ef

Licencia y uso

Icono OpenAccess

Altmetrics

Investigadores/as Institucionales

Badenes-Olmedo CAutor (correspondencia)Corcho OAutor o Coautor

Compartir

17 de octubre de 2018
Publicaciones
>
Conferencia Publicada

Efficient clustering from distributions over topics

Publicado en: Proceedings of the Knowledge Capture Conference, K-CAP 2017. - 2017-12-04 (), DOI: 10.1145/3148011.3148019

Autores:

Badenes-Olmedo, C; Redondo-García, JL; Corcho, O
[+]

Afiliaciones

Amazon Res, Cambridge, England - Autor o Coautor
Amazon Research - Autor o Coautor
Univ Politecn Madrid, Ontol Engn Grp, Boadilla Del Monte, Spain - Autor o Coautor
Universidad Politécnica de Madrid - Autor o Coautor
Ver más

Resumen

© 2017 Copyright held by the owner/author(s). There are many scenarios where we may want to find pairs of textually similar documents in a large corpus (e.g. a researcher doing literature review, or an R&D project manager analyzing project proposals). To programmatically discover those connections can help experts to achieve those goals, but brute-force pairwise comparisons are not computationally adequate when the size of the document corpus is too large. Some algorithms in the literature divide the search space into regions containing potentially similar documents, which are later processed separately from the rest in order to reduce the number of pairs compared. However, this kind of unsupervised methods still incur in high temporal costs. In this paper, we present an approach that relies on the results of a topic modeling algorithm over the documents in a collection, as a means to identify smaller subsets of documents where the similarity function can then be computed. This approach has proved to obtain promising results when identifying similar documents in the domain of scientific publications. We have compared our approach against state of the art clustering techniques and with different configurations for the topic modeling algorithm. Results suggest that our approach outperforms (> 0.5) the other analyzed techniques in terms of efficiency.
[+]

Palabras clave

Large-scale text analysisScholarly dataSemantic similarityTopic models

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

Independientemente del impacto esperado determinado por el canal de difusión, es importante destacar el impacto real observado de la propia aportación.

Según las diferentes agencias de indexación, el número de citas acumuladas por esta publicación hasta la fecha 2026-04-27:

  • WoS: 2
  • Scopus: 9
[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-27:

  • El uso, desde el ámbito académico evidenciado por el indicador de la agencia Altmetric referido como agregaciones realizadas por el gestor bibliográfico personal Mendeley, nos da un total de: 25.

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

  • El Score total de Altmetric: 1.
  • El número de menciones en la red social X (antes Twitter): 3 (Altmetric).

Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

  • El trabajo se ha enviado a una revista cuya política editorial permite la publicación en abierto Open Access.
  • Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://oa.upm.es/52009/
[+]

Análisis de liderazgo de los autores institucionales

Este trabajo se ha realizado con colaboración internacional, concretamente con investigadores de: United Kingdom.

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (BADENES OLMEDO, CARLOS) y Último Autor (CORCHO GARCIA, OSCAR).

el autor responsable de establecer las labores de correspondencia ha sido BADENES OLMEDO, CARLOS.

[+]