Improving aphasic speech recognition by using novel semi-supervised learning methods on aphasiabank for English and Spanish
Publicat a:Applied Sciences-Basel. 11 (19): - 2021-10-01 11(19), DOI: 10.3390/app11198872
Autors: Torre IG; Romero M; Álvarez A
Afiliacions
Resum
Automatic speech recognition in patients with aphasia is a challenging task for which studies have been published in a few languages. Reasonably, the systems reported in the literature within this field show significantly lower performance than those focused on transcribing non-pathological clean speech. It is mainly due to the difficulty of recognizing a more unintelligible voice, as well as due to the scarcity of annotated aphasic data. This work is mainly focused on applying novel semi-supervised learning methods to the AphasiaBank dataset in order to deal with these two major issues, reporting improvements for the English language and providing the first benchmark for the Spanish language for which less than one hour of transcribed aphasic speech was used for training. In addition, the influence of reinforcing the training and decoding processes with out-of-domain acoustic and text data is described by using different strategies and configurations to fine-tune the hyperparameters and the final recognition systems. The interesting results obtained encourage extending this technological approach to other languages and scenarios where the scarcity of annotated data to train recognition models is a challenging reality.
Paraules clau
Indicis de qualitat
Impacte bibliomètric. Anàlisi de la contribució i canal de difusió
El treball ha estat publicat a la revista Applied Sciences-Basel a causa de la seva progressió i el bon impacte que ha aconseguit en els últims anys, segons l'agència WoS (JCR), s'ha convertit en una referència en el seu camp. A l'any de publicació del treball, 2021, es trobava a la posició 39/92, aconseguint així situar-se com a revista Q2 (Segundo Cuartil), en la categoria Engineering, Multidisciplinary. Destacable, igualment, el fet que la revista està posicionada en el Cuartil Q2 para la agencia Scopus (SJR) en la categoría Engineering (Miscellaneous).
Des d'una perspectiva relativa, i atenent a l'indicador de impacte normalitzat calculat a partir de les Citacions Mundials de Scopus Elsevier, proporciona un valor per a la mitjana Ponderada de l'Impacte Normalitzat de l'agència Scopus: 1.9, el que indica que, comparat amb treballs en la mateixa disciplina i en el mateix any de publicació, el situa com un treball citat per sobre de la mitjana. (font consultada: ESI 14 Nov 2024)
Aquesta informació es reforça amb altres indicadors del mateix tipus, que encara que dinàmics en el temps i dependents del conjunt de citacions mitjanes mundials en el moment del seu càlcul, coincideixen a posicionar en algun moment el treball, entre el 50% més citats dins de la seva temàtica:
- Field Citation Ratio (FCR) de la font Dimensions: 11.36 (font consultada: Dimensions Jun 2025)
Concretament, i atenent a les diferents agències d'indexació, aquest treball ha acumulat, fins a la data 2025-06-17, el següent nombre de cites:
- Scopus: 26
- OpenCitations: 17
Impacte i visibilitat social
Anàlisi del lideratge dels autors institucionals
Hi ha un lideratge significatiu, ja que alguns dels autors pertanyents a la institució apareixen com a primer o últim signant, es pot apreciar en el detall: Primer Autor (GONZALEZ TORRE, IVAN) .
l'autor responsable d'establir les tasques de correspondència ha estat GONZALEZ TORRE, IVAN.