{rfName}
Un

APC

2 940,00 Euros
Elsevier
Transformative agreement with library

Llicència i ús

Icono OpenAccess

Altmetrics

Anàlisi d'autories institucional

Huertas-Tato, JavierAutor (correspondència)Martin, AlejandroAutor o coautorCamacho, DavidAutor o coautor

Compartir

18 dejuny de 2024
Publicacions
>
Article

Understanding writing style in social media with a supervised contrastively pre-trained transformer

Publicat a: Knowledge-Based Systems. 296 111867- - 2024-07-19 296(), DOI: 10.1016/j.knosys.2024.111867

Autors:

Huertas-Tato, J; Martín, A; Camacho, D
[+]

Afiliacions

Univ Politecn Madrid, Dept Sistemas Informat, Calle Alan Turing S-N, Madrid 28031, Spain - Autor o coautor

Resum

We introduce the Style Transformer for Authorship Representations (STAR) to detect and characterize writing style in social media. The model is trained on a heterogeneous large corpus derived from public sources with 4 . 5 & sdot; 10 6 authored texts from 70k authors leveraging Supervised Contrastive Loss to minimize the distance between texts authored by the same individual. This pretext pre -training task yields competitive performance at zero -shot with PAN challenges on attribution and clustering. We attain promising results on PAN verification challenges using STAR as a feature extractor. Finally, we present results from our test partition on Reddit, where using a support base of 8 documents of 512 tokens, we can discern authors from sets of up to 1616 authors with at least 80% accuracy. We share our pre -trained model at huggingface AIDA-UPM/star and our code is available at jahuerta92/star.
[+]

Paraules clau

Authorship attributioAuthorship attributionCompetitive performanceContrastive learningLanguage processingLarge corporaNatural language processingNatural language processing systemsNatural languagesPre-trainingSocial mediaSocial networking (online)StarsWriting styleZero-shot learning

Indicis de qualitat

Impacte bibliomètric. Anàlisi de la contribució i canal de difusió

El treball ha estat publicat a la revista Knowledge-Based Systems a causa de la seva progressió i el bon impacte que ha aconseguit en els últims anys, segons l'agència WoS (JCR), s'ha convertit en una referència en el seu camp. A l'any de publicació del treball, 2024 encara no hi ha indicis calculats, però el 2023, es trobava a la posició 26/204, aconseguint així situar-se com a revista Q1 (Primer Cuartil), en la categoria Computer Science, Artificial Intelligence.

Independentment de l'impacte esperat determinat pel canal de difusió, és important destacar l'impacte real observat de la pròpia aportació.

Segons les diferents agències d'indexació, el nombre de citacions acumulades per aquesta publicació fins a la data 2025-12-19:

  • Google Scholar: 10
  • WoS: 2
  • Scopus: 11
[+]

Impacte i visibilitat social

Des de la dimensió d'influència o adopció social, i prenent com a base les mètriques associades a les mencions i interaccions proporcionades per agències especialitzades en el càlcul de les denominades "Mètriques Alternatives o Socials", podem destacar a data 2025-12-19:

  • L'ús d'aquesta aportació en marcadors, bifurcacions de codi, afegits a llistes de favorits per a una lectura recurrent, així com visualitzacions generals, indica que algú està fent servir la publicació com a base del seu treball actual. Això pot ser un indicador destacat de futures cites més formals i acadèmiques. Aquesta afirmació està avalada pel resultat de l'indicador "Capture", que aporta un total de: 22 (PlumX).

És fonamental presentar evidències que recolzin l'alineació plena amb els principis i directrius institucionals sobre Ciència Oberta i la Conservació i Difusió del Patrimoni Intel·lectual. Un clar exemple d'això és:

  • El treball s'ha enviat a una revista la política editorial de la qual permet la publicació en obert Open Access.
  • Assignació d'un Handle/URN com a identificador dins del Dipòsit en el Repositori Institucional: https://oa.upm.es/84340/

Com a resultat de la publicació del treball en el repositori institucional, s'han obtingut dades estadístiques d'ús que reflecteixen el seu impacte. En termes de difusió, podem afirmar que, fins a la data

  • Visualitzacions: 129
  • Descàrregues: 62
[+]

Anàlisi del lideratge dels autors institucionals

Hi ha un lideratge significatiu, ja que alguns dels autors pertanyents a la institució apareixen com a primer o últim signant, es pot apreciar en el detall: Primer Autor (HUERTAS TATO, JAVIER) i Últim Autor (CAMACHO FERNANDEZ, DAVID).

l'autor responsable d'establir les tasques de correspondència ha estat HUERTAS TATO, JAVIER.

[+]

Reconeixements vinculats a l’ítem

This work has been funded by the project PCI2022-134990-2 (MARTINI) of the CHISTERA IV Cofund 2021 program, funded by MCIN/AEI/10.13039/501100011033 and by the "European Union NextGenerationEU/PRTR"; by the Spanish Ministry of Science and Innovation under FightDIS (PID2020-117263GB-I00) ; by MCIN/AEI/10.13039/501100011033/and European Union NextGenerationEU/PRTR for XAI-Disinfodemics (PLEC2021-007681) grant, by European Commission under IBERIFIER PlusIberian Digital Media Observatory (DIGITAL-2023-DEPLOY-04-EDMO-HUBS 101158511) ; by "Convenio Plurianual with the Universidad Politecnica de Madrid in the actuation line of Programa de Excelencia para el Profesorado Universitario", and by EMIF managed by the Calouste Gulbenkian Foundation, in the project MuseAI.
[+]