{rfName}
Mu

Altmetrics

Investigadores/as Institucionales

Navas-Loro MAutor o CoautorGarijo DAutor o CoautorCorcho OAutor o Coautor

Compartir

25 de enero de 2023
Publicaciones
>
Artículo
No

Multi-label Text Classification for Public Procurement in Spanish [Clasificación multi-etiqueta de textos de licitaciones públicas en español]

Publicado en: Procesamiento de Lenguaje Natural. 69 (69): 73-82 - 2022-09-01 69(69), DOI: 10.26342/2022-69-6

Autores:

Navas-Loro, Maria; Garijo, Daniel; Corcho, Oscar
[+]

Afiliaciones

Ontology Engineering Group, AI.nnovation Space, Universidad Politécnica de Madrid, Spain - Autor o Coautor
Univ Politecn Madrid, Ontol Engn Grp, AInnovat Space, Madrid, Spain - Autor o Coautor

Resumen

Public procurement accounts for a 14% of the annual budget of the different governments of the European Union. In Europe, contracting processes are classified using Common Procurement Vocabulary codes (CPVs), a taxonomy designed to facilitate statistical reporting, search and the creation of alerts that can be used by potential bidders. CPVs are commonly assigned manually by public employees in charge of contracting processes. However, CPV classification is not a trivial task, as there are more than 9,000 different CPV categories, which are often assigned following heterogeneous criteria. In this paper we have created a CPV classifier that uses as an input the textual description of the contracting process, and assigns CPVs from the 45 top-level CPV categories. We work only with texts in Spanish, although our approach may be easily extended to other languages. Our results improve the state of the art (10% F1-score improvement) and are available online. © 2022 Sociedad Española para el Procesamiento del Lenguaje Natural.
[+]

Palabras clave

hierarchical classificationmulti-label classificationpublic procurementCpvHierarchical classificationMulti-label classificationPublic procurement

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista Procesamiento de Lenguaje Natural debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia Scopus (SJR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2022, se encontraba en la posición , consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Linguistics and Language.

Independientemente del impacto esperado determinado por el canal de difusión, es importante destacar el impacto real observado de la propia aportación.

Según las diferentes agencias de indexación, el número de citas acumuladas por esta publicación hasta la fecha 2026-04-09:

  • Google Scholar: 7
  • Scopus: 5
[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-09:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 7 (PlumX).

Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

  • Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://oa.upm.es/93618/

Como resultado de la publicación del trabajo en el repositorio institucional, se han obtenido datos estadísticos de uso que reflejan su impacto. En términos de difusión, podemos afirmar que, hasta la fecha

  • Visualizaciones: 27
  • Descargas: 29
[+]

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (NAVAS LORO, MARIA) y Último Autor (CORCHO GARCIA, OSCAR).

[+]

Objetivos del proyecto

La aportación persigue los siguientes objetivos: analizar la problemática de la clasificación manual de los códigos CPV en los procesos de contratación pública, caracterizar la complejidad derivada de la existencia de más de 9,000 categorías CPV y sus criterios heterogéneos de asignación, desarrollar un clasificador automático que utilice descripciones textuales en español para asignar códigos CPV en 45 categorías principales, evaluar el rendimiento del clasificador mediante métricas como la mejora del 10% en la puntuación F1 respecto al estado del arte, y facilitar la extensión del método a otros idiomas para mejorar la eficiencia y precisión en la clasificación de licitaciones públicas.
[+]

Resultados más relevantes

El estudio presenta avances significativos en la clasificación multi-etiqueta de textos de licitaciones públicas en español. Los resultados más relevantes son: se desarrolló un clasificador de CPV que asigna categorías a partir de descripciones textuales, trabajando con los 45 códigos CPV de primer nivel; se enfocó exclusivamente en textos en español, con posibilidad de extensión a otros idiomas; se logró una mejora del 10% en la puntuación F1 respecto al estado del arte; y el sistema está disponible en línea para su uso y evaluación. Estos hallazgos contribuyen a optimizar la clasificación automática en procesos de contratación pública.
[+]