AI-generated estimates of familiarity, concreteness, valence, and arousal for over 100,000 Spanish words

3 de febrero de 2025

Publicaciones

>

Artículo

Gold

AI-generated estimates of familiarity, concreteness, valence, and arousal for over 100,000 Spanish words

Publicado en: QUARTERLY JOURNAL OF EXPERIMENTAL PSYCHOLOGY. 78 (10): 2272-2283 - 2025-10-01 78(10), DOI: 10.31234/osf.io/zqfsj

Autores:

Martinez, Gonzalo; Conde, Javier; Reviriego, Pedro; Brysbaert, Marc

[+]

Afiliaciones

Univ Carlos III Madrid, Leganes - Autor o Coautor

Univ Ghent, Dept Expt Psychol - Autor o Coautor

Univ Politecn Madrid, ETSI Telecomunicac - Autor o Coautor

Resumen

This study investigates whether estimates of familiarity, valence, arousal, and concreteness based on artificial intelligence (AI) are useful alternatives to word counts and human ratings in Spanish. We replicate and extend previous findings in English and show that GPT-4o is effective in estimating these word features. Validity checks even suggest that AI-generated estimates sometimes outperform traditional measurements. The ability to generate AI estimates for large numbers of words at low cost simplifies the process of obtaining word features and provides a new resource for researchers working in Spanish. We provide Excel lists of the collected word features, which can be freely used for research and teaching.

[+]

Palabras clave

ArousalArtificial intelligenceConcretenessFemaleFrequency normsGpt-4HumansLanguageLarge language modelLexical decisionMaleMeaningfulnessMultiword expressionsPsycholinguisticsRecognition, psychologySpainSpanishStrengthValenceVariablesVocabularyWord norms

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista QUARTERLY JOURNAL OF EXPERIMENTAL PSYCHOLOGY debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia Scopus (SJR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2025, se encontraba en la posición , consiguiendo con ello situarse como revista Q2 (Segundo Cuartil), en la categoría Medicine (Miscellaneous). Destacable, igualmente, el hecho de que la Revista está posicionada en el Cuartil Q3 para la agencia WoS (JCR) en la categoría Psychology.

Independientemente del impacto esperado determinado por el canal de difusión, es importante destacar el impacto real observado de la propia aportación.

Según las diferentes agencias de indexación, el número de citas acumuladas por esta publicación hasta la fecha 2026-04-26:

WoS: 7
Scopus: 6

[+]

Análisis de liderazgo de los autores institucionales

Este trabajo se ha realizado con colaboración internacional, concretamente con investigadores de: Belgium.

[+]

Objetivos del proyecto

El presente estudio tiene como objetivos principales analizar la utilidad de las estimaciones generadas por inteligencia artificial (IA) para familiaridad, valencia, activación y concreción en palabras en español; evaluar la efectividad de GPT-4o en la estimación de estas características léxicas; determinar la validez de las estimaciones de IA en comparación con conteos de palabras y valoraciones humanas tradicionales; caracterizar el potencial de las estimaciones de IA para superar en ocasiones las mediciones convencionales; facilitar la generación de estimaciones para un gran número de palabras a bajo costo; y proporcionar recursos accesibles para la investigación y la docencia en lengua española.

[+]

Resultados más relevantes

El estudio presenta resultados significativos sobre la estimación de características léxicas mediante inteligencia artificial en español. En primer lugar, se demuestra que GPT-4o es eficaz para estimar familiaridad, valencia, activación y concreción de más de 100,000 palabras. En segundo lugar, las comprobaciones de validez indican que las estimaciones generadas por IA a veces superan a las mediciones tradicionales basadas en recuentos y valoraciones humanas. En tercer lugar, la generación de estas estimaciones a gran escala y bajo costo facilita la obtención de características léxicas para la investigación. Finalmente, se proporciona un recurso accesible en formato Excel para su uso en investigación y docencia.

[+]

Indexado en

Licencia y uso

Citaciones

Altmetrics

Investigadores/as Institucionales

Compartir

AI-generated estimates of familiarity, concreteness, valence, and arousal for over 100,000 Spanish words

Afiliaciones

Resumen

Palabras clave

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

Análisis de liderazgo de los autores institucionales

Objetivos del proyecto

Resultados más relevantes

Ítems relacionados

Indexado en

Licencia y uso

Citaciones

Altmetrics

Investigadores/as Institucionales

Compartir

AI-generated estimates of familiarity, concreteness, valence, and arousal for over 100,000 Spanish words

Afiliaciones

Resumen

Palabras clave

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

Impacto y visibilidad social

Análisis de liderazgo de los autores institucionales

Objetivos del proyecto

Resultados más relevantes

Ítems relacionados