Improving aphasic speech recognition by using novel semi-supervised learning methods on aphasiabank for English and Spanish
Publicado en:Applied Sciences-Basel. 11 (19): - 2021-10-01 11(19), DOI: 10.3390/app11198872
Autores: Torre IG; Romero M; Álvarez A
Afiliaciones
Resumen
Automatic speech recognition in patients with aphasia is a challenging task for which studies have been published in a few languages. Reasonably, the systems reported in the literature within this field show significantly lower performance than those focused on transcribing non-pathological clean speech. It is mainly due to the difficulty of recognizing a more unintelligible voice, as well as due to the scarcity of annotated aphasic data. This work is mainly focused on applying novel semi-supervised learning methods to the AphasiaBank dataset in order to deal with these two major issues, reporting improvements for the English language and providing the first benchmark for the Spanish language for which less than one hour of transcribed aphasic speech was used for training. In addition, the influence of reinforcing the training and decoding processes with out-of-domain acoustic and text data is described by using different strategies and configurations to fine-tune the hyperparameters and the final recognition systems. The interesting results obtained encourage extending this technological approach to other languages and scenarios where the scarcity of annotated data to train recognition models is a challenging reality.
Palabras clave
Indicios de calidad
Impacto bibliométrico. Análisis de la aportación y canal de difusión
El trabajo ha sido publicado en la revista Applied Sciences-Basel debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2021, se encontraba en la posición 39/92, consiguiendo con ello situarse como revista Q2 (Segundo Cuartil), en la categoría Engineering, Multidisciplinary. Destacable, igualmente, el hecho de que la Revista está posicionada en el Cuartil Q2 para la agencia Scopus (SJR) en la categoría Engineering (Miscellaneous).
Desde una perspectiva relativa, y atendiendo al indicador del impacto normalizado calculado a partir de las Citas Mundiales de Scopus Elsevier, arroja un valor para la media Ponderada del Impacto Normalizado de la agencia Scopus: 1.9, lo que indica que, de manera comparada con trabajos en la misma disciplina y en el mismo año de publicación, lo ubica como trabajo citado por encima de la media. (fuente consultada: ESI 14 Nov 2024)
Esta información viene reforzada por otros indicadores del mismo tipo, que aunque dinámicos en el tiempo y dependientes del conjunto de citaciones medias mundiales en el momento de su cálculo, coinciden en posicionar en algún momento al trabajo, entre el 50% más citados dentro de su temática:
- Field Citation Ratio (FCR) de la fuente Dimensions: 11.58 (fuente consultada: Dimensions May 2025)
De manera concreta y atendiendo a las diferentes agencias de indexación, el trabajo ha acumulado, hasta la fecha 2025-05-18, el siguiente número de citas:
- Scopus: 26
- OpenCitations: 17
Impacto y visibilidad social
Análisis de liderazgo de los autores institucionales
Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (GONZALEZ TORRE, IVAN) .
el autor responsable de establecer las labores de correspondencia ha sido GONZALEZ TORRE, IVAN.