Audio-visual emotion recognition using FCBF feature selection method and particle swarm optimization for fuzzy ARTMAP neural networks
Publicado en:Multimedia Tools And Applications. 76 (2): 2331-2352 - 2017-01-01 76(2), DOI: 10.1007/s11042-015-3180-6
Autores: Gharavian D; Bejani M; Sheikhan M
Afiliaciones
Resumen
© 2016, Springer Science+Business Media New York. Humans use many modalities such as face, speech and body gesture to express their feeling. So, to make emotional computers and make the human-computer interaction (HCI) more naturally and friendly, computers should be able to understand human feelings using speech and visual information. In this paper, we recognize the emotions from audio and visual information using fuzzy ARTMAP neural network (FAMNN). Audio and visual systems fuse at decision and feature levels. Finally, the particle swarm optimization (PSO) is employed to determine the optimum values of the choice parameter (α), the vigilance parameters (ρ), and the learning rate (β) of the FAMNN. Experimental results showed that the feature-level and decision-level fusions improve the outcome of unimodal systems. Also PSO improved the recognition rate. By using the PSO-optimized FAMNN at feature level fusion, the recognition rate was improved by about 57 % with respect to the audio system and by about 4.5 % with respect to the visual system. The final emotion recognition rate on the SAVEE database was reached to 98.25 % using audio and visual features by using optimized FAMNN.
Palabras clave
Indicios de calidad
Impacto bibliométrico. Análisis de la aportación y canal de difusión
El trabajo ha sido publicado en la revista Multimedia Tools And Applications debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2017, se encontraba en la posición 42/104, consiguiendo con ello situarse como revista Q2 (Segundo Cuartil), en la categoría Computer Science, Software Engineering. Destacable, igualmente, el hecho de que la Revista está posicionada en el Cuartil Q2 para la agencia Scopus (SJR) en la categoría Computer Networks and Communications.
Desde una perspectiva relativa, y atendiendo al indicador del impacto normalizado calculado a partir de las Citas Mundiales proporcionadas por WoS (ESI, Clarivate), arroja un valor para la normalización de citas relativas a la tasa de citación esperada de: 1.11. Esto indica que, de manera comparada con trabajos en la misma disciplina y en el mismo año de publicación, lo ubica como trabajo citado por encima de la media. (fuente consultada: ESI 14 Nov 2024)
Esta información viene reforzada por otros indicadores del mismo tipo, que aunque dinámicos en el tiempo y dependientes del conjunto de citaciones medias mundiales en el momento de su cálculo, coinciden en posicionar en algún momento al trabajo, entre el 50% más citados dentro de su temática:
- Media Ponderada del Impacto Normalizado de la agencia Scopus: 1.71 (fuente consultada: FECYT Feb 2024)
- Field Citation Ratio (FCR) de la fuente Dimensions: 8.11 (fuente consultada: Dimensions Jun 2025)
De manera concreta y atendiendo a las diferentes agencias de indexación, el trabajo ha acumulado, hasta la fecha 2025-06-10, el siguiente número de citas:
- WoS: 25
- Scopus: 42
- OpenCitations: 29
Impacto y visibilidad social
Análisis de liderazgo de los autores institucionales
Este trabajo se ha realizado con colaboración internacional, concretamente con investigadores de: Iran.