{rfName}
Ne

Altmetrics

Investigadores/as Institucionales

Camara, MateoAutor (correspondencia)Blanco-Murillo, Jose LuisAutor o CoautorBlanco, Jose LuisAutor o Coautor

Compartir

21 de enero de 2026
Publicaciones
>
Review
No

Neural Audio Synthesis for Sound Effects: A Scope Review

Publicado en: IEEE Transactions on Audio Speech and Language Processing. 34 427-445 - 2026-01-01 34(), DOI: 10.1109/TASLPRO.2025.3646080

Autores:

Camara, Mateo; Marcos, Fernando; Bargum, Anders R; Erkut, Cumhur; Reiss, Joshua; Blanco, Jose Luis
[+]

Afiliaciones

Aalborg Univ, Multisensory Experience Lab, DK-2450 Copenhagen, Denmark - Autor o Coautor
Queen Mary Univ London, Ctr Digital Mus, London E1 4NS, England - Autor o Coautor
Univ Politec Madrid, Informat Proc & Telecommun Ctr, Madrid 28040, Spain - Autor o Coautor
Univ Politecn Madrid, Signal Proc Applicat Grp, Madrid 28040, Spain - Autor o Coautor
Ver más

Resumen

Neural Audio Synthesis is dedicated to generating sound through generative neural networks. Sound effects are defined as auditory elements that complement a specific scene (in cinema, fiction, or videogames), support a storyline, enhance a fictional environment, or improve the perceived plausibility and presence (including Virtual Reality) without being music or dialog. This manuscript presents a quantitative literature review of the literature that intersects these two domains: the neural generation of sound effects. By leveraging large language models, we performed an extensive and systematic survey of the major scientific repositories, filtering the most relevant articles to ensure a thorough analysis. Our study examines various generation paradigms employed in sound synthesis, the specific types of sound effects created, the datasets used, and the evaluation metrics considered. Furthermore, we provide a forward-looking discussion on the evolution of this field towards multimodal approaches, where sound generation might integrate with other sensory modalities. All supporting materials and code are available online.
[+]

Palabras clave

Acoustic generatorsAudio acousticsAudio signalAudio signal processingAudio synthesisDeep learningFoley effectFoley effectsGenerationGenerative synthesisInteractive computer graphicsMeasurementMediaModelNeural audio synthesisNeural networksNeural-networksPipelinesReal-time systemsReviewsSfxSignal-processingSound effectsSpeech processingTaxonomyTrainingVideo-gamesVirtual reality

Indicios de calidad

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-06:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 4 (PlumX).
[+]

Análisis de liderazgo de los autores institucionales

Este trabajo se ha realizado con colaboración internacional, concretamente con investigadores de: Denmark; United Kingdom.

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (CAMARA LARGO, MATEO JOSE) y Último Autor (YAGÜE BLANCO, JOSE LUIS).

el autor responsable de establecer las labores de correspondencia ha sido CAMARA LARGO, MATEO JOSE.

[+]

Reconocimientos ligados al ítem

This work was supported in part by the European Union's Horizon 2020 Research and Innovation Programme under Grant 101003750 and in part by the Ministry of Economy and Competitiveness of Spain under Grant PID2021-128469OB-I00
[+]