{rfName}
As

Citaciones

1

Altmetrics

Investigadores/as Institucionales

Arriaga, CarlosAutor (correspondencia)Pozo, AlejandroAutor o CoautorConde, JavierAutor o CoautorAlonso, AlvaroAutor o Coautor

Compartir

4 de marzo de 2026
Publicaciones
>
Artículo
No

Assessing Latency in ASR Systems: A Methodological Perspective for Real-Time Use

Publicado en: IEEE INTERNET COMPUTING. 29 (5): 17-24 - 2025-09-01 29(5), DOI: 10.1109/mic.2025.3614363

Autores:

Arriaga, Carlos; Pozo, Alejandro; Conde, Javier; Alonso, Alvaro
[+]

Afiliaciones

Univ Politecn Madrid, Madrid 28040, Spain - Autor o Coautor

Resumen

Automatic speech recognition (ASR) systems generate real-time transcriptions but often miss nuances that human interpreters capture. While ASR is useful in many contexts, interpreters-who already use ASR tools such as Dragon-add critical value, especially in sensitive settings such as diplomatic meetings where subtle language is key. Human interpreters not only perceive these nuances but can adjust in real time, improving accuracy, while ASR handles basic transcription tasks. However, ASR systems introduce a delay that does not align with real-time interpretation needs. The user-perceived latency of ASR systems differs from that of interpretation because it measures the time between speech and transcription delivery. To address this, we propose a new approach to measuring delay in ASR systems and validate if they are usable in live interpretation scenarios.
[+]

Palabras clave

Artificial intelligenceDelaysHardwareLoss measurementMathematical modelsMeasurementReal-time systemsSpeech to textTime measurementTransformers

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista IEEE INTERNET COMPUTING debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2025, se encontraba en la posición 19/129, consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Computer Science, Software Engineering.

[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-09:

  • El uso, desde el ámbito académico evidenciado por el indicador de la agencia Altmetric referido como agregaciones realizadas por el gestor bibliográfico personal Mendeley, nos da un total de: 10.
  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 10 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

  • El Score total de Altmetric: 1.
  • El número de menciones en la red social X (antes Twitter): 1 (Altmetric).

Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

  • Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://oa.upm.es/91436/

Como resultado de la publicación del trabajo en el repositorio institucional, se han obtenido datos estadísticos de uso que reflejan su impacto. En términos de difusión, podemos afirmar que, hasta la fecha

  • Visualizaciones: 64
  • Descargas: 191
[+]

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (ARRIAGA PRIETO, CARLOS) y Último Autor (ALONSO GONZALEZ, ALVARO).

el autor responsable de establecer las labores de correspondencia ha sido ARRIAGA PRIETO, CARLOS.

[+]

Objetivos del proyecto

Este trabajo persigue los siguientes objetivos: analizar la latencia en sistemas de reconocimiento automático de voz (ASR) desde una perspectiva metodológica; evaluar la diferencia entre la latencia percibida por el usuario (UPL) y la latencia en interpretación humana en tiempo real; determinar la adecuación de los sistemas ASR para su uso en escenarios de interpretación en vivo; caracterizar el impacto de la demora en la precisión y utilidad de las transcripciones generadas por ASR; y validar un nuevo método para medir el retraso en sistemas ASR, con especial atención a contextos sensibles como reuniones diplomáticas donde las sutilezas del lenguaje son cruciales.
[+]

Resultados más relevantes

El estudio aborda la evaluación de la latencia en sistemas de reconocimiento automático de voz (ASR) para su uso en tiempo real. Los resultados más relevantes son: 1) Los sistemas ASR generan transcripciones en tiempo real pero presentan una latencia que no cumple con los requisitos de interpretación simultánea. 2) La latencia percibida por el usuario (UPL) en ASR difiere significativamente de la latencia en interpretación humana, afectando la sincronización. 3) Se propone un nuevo método para medir la demora en sistemas ASR, que permite evaluar su idoneidad en escenarios de interpretación en vivo. 4) La validación del método confirma que, aunque ASR es útil para tareas básicas, no reemplaza la capacidad de ajuste en tiempo real de intérpretes humanos.
[+]

Reconocimientos ligados al ítem

The authors would like to acknowledge the support of the FUN4DATE (PID2022-136684OB-C22) project funded by the Spanish Agencia Estatal de Investigacion (AEI 10.13039/501100011033), the TUCAN6-CM (TEC-2024/COM-460) project funded by CM (ORDEN5696/2024), and the Ministerio de Ciencia, Innovacion y Universidades (Grant FPU21/03069).
[+]