A reinforcement learning strategy for p-adaptation in high order solvers

19 de septiembre de 2024

Publicaciones

>

Artículo

Sí

A reinforcement learning strategy for p-adaptation in high order solvers

Publicado en: Results in Engineering. 21 101693- - 2024-03-01 21(), DOI: 10.1016/j.rineng.2023.101693

Autores:

Huergo, D; Rubio, G; Ferrer, E

[+]

Afiliaciones

Univ Politecn Madrid, Ctr Computat Simulat, Campus Montegancedo, Boadilla Del Monte 28660, Madrid, Spain - Autor o Coautor

Univ Politecn Madrid, Sch Aeronaut, ETSIAE UPM, Plaza Cardenal Cisneros 3, E-28040 Madrid, Spain - Autor o Coautor

Resumen

Reinforcement learning (RL) has emerged as a promising approach to automating decision processes. This paper explores the application of RL techniques to optimise the polynomial order in the computational mesh when using high-order solvers. Mesh adaptation plays a crucial role in improving the efficiency of numerical simulations by increasing accuracy while reducing the cost. Here, actor-critic RL models based on Proximal Policy Optimization offer an approach for agents to learn optimal mesh modifications based on evolving conditions. The paper provides a strategy for p-adaptation in high-order solvers and includes insights into the main aspects of RL-based mesh adaptation, including the formulation of appropriate reward structures and the interaction between the RL agent and the simulation environment. The proposed strategy does not require a high-fidelity solution during the training process and the formulation is general for any computational mesh and partial differential equation (PDE), solved in a discontinuous Galerkin solver. We discuss the impact of RL-based mesh p-adaptation on computational efficiency and accuracy. We apply the RL p-adaptation strategy to a one-dimensional inviscid Burgers' equation, focusing our analysis on smooth solutions of the equation to showcase its effectiveness. The RL strategy reduces the computational cost and improves accuracy over uniform adaptation, while minimising human intervention.

[+]

Palabras clave

High-order discontinuous galerkinMesh adaptatioMesh adaptationP-adaptationProximal policy optimizationReinforcement learning

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista Results in Engineering debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2024 aún no existen indicios calculados, pero en 2023, se encontraba en la posición 6/179, consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Engineering, Multidisciplinary. Destacable, igualmente, el hecho de que la Revista está posicionada por encima del Percentil 90.

Independientemente del impacto esperado determinado por el canal de difusión, es importante destacar el impacto real observado de la propia aportación.

Según las diferentes agencias de indexación, el número de citas acumuladas por esta publicación hasta la fecha 2026-04-26:

Google Scholar: 3
WoS: 5
Scopus: 5

[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2026-04-26:

El uso, desde el ámbito académico evidenciado por el indicador de la agencia Altmetric referido como agregaciones realizadas por el gestor bibliográfico personal Mendeley, nos da un total de: 13.
La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 13 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

El Score total de Altmetric: 3.
El número de menciones en la red social X (antes Twitter): 3 (Altmetric).

Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

El trabajo se ha enviado a una revista cuya política editorial permite la publicación en abierto Open Access.
Asignación de un Handle/URN como identificador dentro del Depósito en el Repositorio Institucional: https://oa.upm.es/86484/

Como resultado de la publicación del trabajo en el repositorio institucional, se han obtenido datos estadísticos de uso que reflejan su impacto. En términos de difusión, podemos afirmar que, hasta la fecha

Visualizaciones: 152
Descargas: 40

[+]

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (HUERGO PEREA, DAVID) y Último Autor (FERRER VACCAREZZA, ESTEBAN).

el autor responsable de establecer las labores de correspondencia ha sido HUERGO PEREA, DAVID.

[+]

Reconocimientos ligados al ítem

EF would like to thank the support of Agencia Estatal de Investigacion (for the grant "Europa Excelencia 2022" Proyecto EUR2022- 134041/AEI/10.13039/501100011033) y del Mecanismo de Recuperacion y Resiliencia de la Union Europea, and the Comunidad de Madrid and Universidad Politecnica de Madrid for the Young Investigators award: APOYO-JOVENES-21-53NYUB-19-RRX1A0. GR and EF acknowledge the funding received by the Grant DeepCFD (Project No. PID2022-137899OB-I00) funded by ERDF A way of making Europe and MCIN/AEI/10.13039/501100011033/. Finally, all authors gratefully acknowledge the Universidad Politecnica de Madrid (www.upm. es) for providing computing resources on Magerit Supercomputer.r peracion y Resiliencia de la Union Europea, and the Comunidad de Madrid and Universidad Politecnica de Madrid for the Young Investi-gators award: APOYO-JOVENES-21-53NYUB-19-RRX1A0. GR and EF acknowledge the funding received by the Grant DeepCFD (Project No. PID2022-137899OB-I00) funded by ERDF A way of making Europe and MCIN/AEI/10.13039/501100011033/. Finally, all authors grate-fully acknowledge the Universidad Politecnica de Madrid ( www.upm. es) for providing computing resources on Magerit Supercomputer.

[+]

Indexado en

Licencia y uso

Citaciones

Altmetrics

Investigadores/as Institucionales

Compartir

A reinforcement learning strategy for p-adaptation in high order solvers

Afiliaciones

Resumen

Palabras clave

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

Análisis de liderazgo de los autores institucionales

Reconocimientos ligados al ítem