{rfName}
AI

Licencia y uso

Icono OpenAccess

Altmetrics

Investigadores/as Institucionales

Conde, JAutor o CoautorReviriego, PAutor o Coautor

Compartir

3 de febrero de 2025
Publicaciones
>
Artículo
Gold

AI-generated estimates of familiarity, concreteness, valence, and arousal for over 100,000 Spanish words

Publicado en: QUARTERLY JOURNAL OF EXPERIMENTAL PSYCHOLOGY. 78 (10): 2272-2283 - 2025-10-01 78(10), DOI: 10.31234/osf.io/zqfsj

Autores:

Martinez, Gonzalo; Conde, Javier; Reviriego, Pedro; Brysbaert, Marc
[+]

Afiliaciones

Univ Carlos III Madrid, Leganes - Autor o Coautor
Univ Ghent, Dept Expt Psychol - Autor o Coautor
Univ Politecn Madrid, ETSI Telecomunicac - Autor o Coautor
Ver más

Resumen

This study investigates whether estimates of familiarity, valence, arousal, and concreteness based on artificial intelligence (AI) are useful alternatives to word counts and human ratings in Spanish. We replicate and extend previous findings in English and show that GPT-4o is effective in estimating these word features. Validity checks even suggest that AI-generated estimates sometimes outperform traditional measurements. The ability to generate AI estimates for large numbers of words at low cost simplifies the process of obtaining word features and provides a new resource for researchers working in Spanish. We provide Excel lists of the collected word features, which can be freely used for research and teaching.
[+]

Palabras clave

ArousalArtificial intelligenceConcretenessFemaleFrequency normsGpt-4HumansLanguageLarge language modelLexical decisionMaleMeaningfulnessMultiword expressionsPsycholinguisticsRecognition, psychologySpainSpanishStrengthValenceVariablesVocabularyWord norms

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista QUARTERLY JOURNAL OF EXPERIMENTAL PSYCHOLOGY debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia Scopus (SJR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2025, se encontraba en la posición , consiguiendo con ello situarse como revista Q2 (Segundo Cuartil), en la categoría Medicine (Miscellaneous). Destacable, igualmente, el hecho de que la Revista está posicionada en el Cuartil Q3 para la agencia WoS (JCR) en la categoría Psychology.

Independientemente del impacto esperado determinado por el canal de difusión, es importante destacar el impacto real observado de la propia aportación.

Según las diferentes agencias de indexación, el número de citas acumuladas por esta publicación hasta la fecha 2026-04-26:

  • WoS: 7
  • Scopus: 6
[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-26:

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

  • El Score total de Altmetric: 1.
  • El número de menciones en la red social X (antes Twitter): 2 (Altmetric).

Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

  • El trabajo se ha enviado a una revista cuya política editorial permite la publicación en abierto Open Access.
  • Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://oa.upm.es/85140/

Como resultado de la publicación del trabajo en el repositorio institucional, se han obtenido datos estadísticos de uso que reflejan su impacto. En términos de difusión, podemos afirmar que, hasta la fecha

  • Visualizaciones: 296
  • Descargas: 266
[+]

Análisis de liderazgo de los autores institucionales

Este trabajo se ha realizado con colaboración internacional, concretamente con investigadores de: Belgium.

[+]

Objetivos del proyecto

El presente estudio tiene como objetivos principales analizar la utilidad de las estimaciones generadas por inteligencia artificial (IA) para familiaridad, valencia, activación y concreción en palabras en español; evaluar la efectividad de GPT-4o en la estimación de estas características léxicas; determinar la validez de las estimaciones de IA en comparación con conteos de palabras y valoraciones humanas tradicionales; caracterizar el potencial de las estimaciones de IA para superar en ocasiones las mediciones convencionales; facilitar la generación de estimaciones para un gran número de palabras a bajo costo; y proporcionar recursos accesibles para la investigación y la docencia en lengua española.
[+]

Resultados más relevantes

El estudio presenta resultados significativos sobre la estimación de características léxicas mediante inteligencia artificial en español. En primer lugar, se demuestra que GPT-4o es eficaz para estimar familiaridad, valencia, activación y concreción de más de 100,000 palabras. En segundo lugar, las comprobaciones de validez indican que las estimaciones generadas por IA a veces superan a las mediciones tradicionales basadas en recuentos y valoraciones humanas. En tercer lugar, la generación de estas estimaciones a gran escala y bajo costo facilita la obtención de características léxicas para la investigación. Finalmente, se proporciona un recurso accesible en formato Excel para su uso en investigación y docencia.
[+]

Ítems relacionados