{rfName}
An

Altmetrics

Impacto en los Objetivos de Desarrollo Sostenible (ODS)

Investigadores/as Institucionales

Navas-Loro, MariaAutor (correspondencia)Rodriguez-Doncel, VictorAutor o Coautor

Compartir

4 de octubre de 2020
Publicaciones
>
Artículo
No

Annotador: a temporal tagger for Spanish

Publicado en: JOURNAL OF INTELLIGENT & FUZZY SYSTEMS. 39 (2): 1979-1991 - 2020-01-01 39(2), DOI: 10.3233/JIFS-179865

Autores:

Navas-Loro, M; Rodríguez-Doncel, V
[+]

Afiliaciones

Univ Politecn Madrid, Ontol Engn Grp, Campus Montegancedo S-N, Madrid 28660, Spain - Autor o Coautor

Resumen

Temporal information is crucial in knowledge extraction. Being able to locate events in a timeline is necessary to understand the narrative behind every text. To this aim, several temporal taggers have been proposed in literature -nevertheless, not all languages received the same attention. Most taggers work only for English texts, and not many have been developed for other languages. Also the scarcity of annotated corpora in other languages notably hinders the task. In this paper we present a new rule-based tagger called Annotador (Anotador in Spanish) able to process texts both in Spanish and English. Furthermore, a new corpus with more than 300 short texts containing common temporal expressions, called the HourGlass corpus, has been built in order to test it and to facilitate the development of new resources and tools. Professionals from different domains intervened in the gathering of the text, making it heterogeneous and easy to use thanks to the tags added to each entry. Finally, we analyzed main challenges in the time expression extraction task.
[+]

Palabras clave

NlpQuality educationSpanish languageTemporal taggerTime expression

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista JOURNAL OF INTELLIGENT & FUZZY SYSTEMS debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia Scopus (SJR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2020, se encontraba en la posición , consiguiendo con ello situarse como revista Q2 (Segundo Cuartil), en la categoría Artificial Intelligence.

Independientemente del impacto esperado determinado por el canal de difusión, es importante destacar el impacto real observado de la propia aportación.

Según las diferentes agencias de indexación, el número de citas acumuladas por esta publicación hasta la fecha 2026-04-25:

  • Google Scholar: 19
  • WoS: 10
  • Scopus: 12
[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-25:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 6 (PlumX).

Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

  • Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://oa.upm.es/93339/

Como resultado de la publicación del trabajo en el repositorio institucional, se han obtenido datos estadísticos de uso que reflejan su impacto. En términos de difusión, podemos afirmar que, hasta la fecha

  • Visualizaciones: 25
  • Descargas: 10
Siguiendo con el impacto social del trabajo, es importante enfatizar el hecho de que, por su contenido, puede ser asignado a la línea de interés del ODS 4 - Quality Education, con una probabilidad del 76% según el algoritmo mBERT desarrollado por Aurora University.
[+]

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (NAVAS LORO, MARIA) y Último Autor (RODRIGUEZ DONCEL, VICTOR).

el autor responsable de establecer las labores de correspondencia ha sido NAVAS LORO, MARIA.

[+]

Objetivos del proyecto

La aportación persigue los siguientes objetivos: desarrollar un etiquetador temporal basado en reglas capaz de procesar textos en español e inglés; construir un nuevo corpus denominado HourGlass con más de 300 textos cortos que contienen expresiones temporales comunes; facilitar el desarrollo de recursos y herramientas mediante la creación de un corpus heterogéneo y anotado por profesionales de distintos ámbitos; analizar los principales desafíos en la tarea de extracción de expresiones temporales; y contribuir a superar la escasez de corpus anotados en idiomas distintos al inglés.
[+]

Resultados más relevantes

Los resultados más relevantes de esta aportación se centran en el desarrollo y evaluación de una herramienta para el etiquetado temporal en textos en español e inglés. En primer lugar, se presenta Annotador, un etiquetador basado en reglas capaz de procesar ambos idiomas. En segundo lugar, se ha construido el corpus HourGlass, compuesto por más de 300 textos breves con expresiones temporales comunes, diseñado para evaluar el etiquetador y fomentar la creación de recursos similares. En tercer lugar, la heterogeneidad del corpus se asegura mediante la participación de profesionales de diversos ámbitos y la inclusión de etiquetas detalladas en cada texto. Finalmente, se identifican y analizan los principales desafíos en la extracción de expresiones temporales.
[+]

Reconocimientos ligados al ítem

This paper has been supported by the Lynx H2020 project (grant agreement No. 780602), and is part of a PhD thesis funded by a Predoctoral grant of the Universidad Politecnica de Madrid. We would also want to thank all the contributors to our corpus.
[+]