{rfName}
BE

APC

1 672,00 Euros

Licencia y uso

Icono OpenAccess

Altmetrics

Investigadores/as Institucionales

Huertas-Tato JAutor (correspondencia)Martín García, AlejandroAutor o CoautorCamacho DAutor o Coautor

Compartir

31 de julio de 2023
Publicaciones
>
Artículo
Hybrid Gold

BERTuit: Understanding Spanish language in Twitter with transformers

Publicado en: Expert Systems. 40 (9): - 2023-11-01 40(9), DOI: 10.1111/exsy.13404

Autores:

Huertas-Tato, J; Martín, A; Camacho, D
[+]

Afiliaciones

Univ Politecn Madrid, Dept Informat, Madrid 28031, Spain - Autor o Coautor
Universidad Politécnica de Madrid - Autor o Coautor

Resumen

The appearance of complex attention-based language models such as BERT, RoBERTa or GPT-3 has allowed to address highly complex tasks in a plethora of scenarios. However, when applied to specific domains, these models encounter considerable difficulties. This is the case of Social Networks such as Twitter, an ever-changing stream of information written with informal and complex language, where each message requires careful evaluation to be understood even by humans given the important role that context plays. Addressing tasks in this domain through Natural Language Processing involves severe challenges. When powerful state-of-the-art multilingual language models are applied to this scenario, language specific nuances get lost in translation. To face these challenges we present BERTuit, the largest transformer proposed so far for Spanish language, pre-trained on a massive dataset of 230 M Spanish tweets using RoBERTa optimization. Our motivation is to provide a powerful resource to better understand Spanish Twitter and to be used on applications focused on this social network, with special emphasis on solutions devoted to tackle the spreading of misinformation in this platform. BERTuit is evaluated on several tasks and compared against M-BERT, XLM-RoBERTa and XLM-T, very competitive multilingual transformers. The utility of our approach is shown with applications, in this case: an unsupervised methodology to visualize groups of hoaxes; and supervised profiling of authors spreading disinformation.
[+]

Palabras clave

online social networkstransformerstwitterMisinformationOnline social networksTransformersTwitter

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista Expert Systems debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2023, se encontraba en la posición 41/144, consiguiendo con ello situarse como revista Q2 (Segundo Cuartil), en la categoría Computer Science, Theory & Methods. Destacable, igualmente, el hecho de que la Revista está posicionada en el Cuartil Q2 para la agencia Scopus (SJR) en la categoría Control and Systems Engineering.

Independientemente del impacto esperado determinado por el canal de difusión, es importante destacar el impacto real observado de la propia aportación.

Según las diferentes agencias de indexación, el número de citas acumuladas por esta publicación hasta la fecha 2025-12-20:

  • Google Scholar: 4
  • WoS: 2
  • Scopus: 5
[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-12-20:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 31 (PlumX).

Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

  • El trabajo se ha enviado a una revista cuya política editorial permite la publicación en abierto Open Access.
  • Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://oa.upm.es/88862/

Como resultado de la publicación del trabajo en el repositorio institucional, se han obtenido datos estadísticos de uso que reflejan su impacto. En términos de difusión, podemos afirmar que, hasta la fecha

  • Visualizaciones: 139
  • Descargas: 29
[+]

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (HUERTAS TATO, JAVIER) y Último Autor (CAMACHO FERNANDEZ, DAVID).

el autor responsable de establecer las labores de correspondencia ha sido HUERTAS TATO, JAVIER.

[+]