{rfName}
Tr

Indexado en

Licencia y uso

Icono OpenAccess

Altmetrics

Investigadores/as Institucionales

Pedrera Jiménez, MiguelAutor (correspondencia)

Compartir

24 de octubre de 2022
Publicaciones
>
Artículo

TransformEHRs: a flexible methodology for building transparent ETL processes for EHR reuse

Publicado en: Methods Of Information In Medicine. 61 (S 02): E89-E102 - 2022-01-01 61(S 02), DOI: 10.1055/s-0042-1757763

Autores:

Pedrera-Jimenez, Miguel; Garcia-Barrio, Noelia; Rubio-Mayo, Paula; Tato-Gomez, Alberto; Luis Cruz-Bermudez, Juan; Luis Bernal-Sobrino, Jose; Munoz-Carrero, Adolfo; Serrano-Balazote, Pablo;
[+]

Afiliaciones

Inst Invest Sanitaria Hosp Univ 12 Octubre, Data Sci Unit, Madrid, Spain - Autor o Coautor
Inst Salud Carlos III, Digital Hlth Res Unit, Madrid, Spain - Autor o Coautor
Univ Politecn Madrid, ETSI Telecomunicac, Madrid, Spain - Autor o Coautor
Ver más

Resumen

Background During the COVID-19 pandemic, several methodologies were designed for obtaining electronic health record (EHR)-derived datasets for research. These processes are often based on black boxes, on which clinical researchers are unaware of how the data were recorded, extracted, and transformed. In order to solve this, it is essential that extract, transform, and load (ETL) processes are based on transparent, homogeneous, and formal methodologies, making them understandable, reproducible, and auditable. Objectives This study aims to design and implement a methodology, according with FAIR Principles, for building ETL processes (focused on data extraction, selection, and transformation) for EHR reuse in a transparent and flexible manner, applicable to any clinical condition and health care organization. Methods The proposed methodology comprises four stages: (1) analysis of secondary use models and identification of data operations, based on internationally used clinical repositories, case report forms, and aggregated datasets; (2) modeling and formalization of data operations, through the paradigm of the Detailed Clinical Models; (3) agnostic development of data operations, selecting SQL and R as programming languages; and (4) automation of the ETL instantiation, building a formal configuration file with XML. Results First, four international projects were analyzed to identify 17 operations, necessary to obtain datasets according to the specifications of these projects from the EHR. With this, each of the data operations was formalized, using the ISO 13606 reference model, specifying the valid data types as arguments, inputs and outputs, and their cardinality. Then, an agnostic catalog of data was developed through data-oriented programming languages previously selected. Finally, an automated ETL instantiation process was built from an ETL configuration file formally defined. Conclusions This study has provided a transparent and flexible solution to the difficulty of making the processes for obtaining EHR-derived data for secondary use understandable, auditable, and reproducible. Moreover, the abstraction carried out in this study means that any previous EHR reuse methodology can incorporate these results into them.
[+]

Palabras clave

AgnosticArticleAutomationCase reportClinical articleComputer languageCovid-19Data exchangeData extractionData reusabilityDesignElectronic health recordElectronic health recordsEpidemiologyFair principlesHealth care organizationHumanHumansInformaticsPandemicPandemicsReal-world dataStandards

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista Methods Of Information In Medicine debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia Scopus (SJR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2022, se encontraba en la posición , consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Advanced and Specialized Nursing.

Independientemente del impacto esperado determinado por el canal de difusión, es importante destacar el impacto real observado de la propia aportación.

Según las diferentes agencias de indexación, el número de citas acumuladas por esta publicación hasta la fecha 2025-12-21:

  • Google Scholar: 7
  • WoS: 1
  • Scopus: 4
[+]

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-12-21:

  • El uso, desde el ámbito académico evidenciado por el indicador de la agencia Altmetric referido como agregaciones realizadas por el gestor bibliográfico personal Mendeley, nos da un total de: 26.
  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 26 (PlumX).

Con una intencionalidad más de divulgación y orientada a audiencias más generales podemos observar otras puntuaciones más globales como:

  • El Score total de Altmetric: 1.
  • El número de menciones en la red social X (antes Twitter): 2 (Altmetric).

Es fundamental presentar evidencias que respalden la plena alineación con los principios y directrices institucionales en torno a la Ciencia Abierta y la Conservación y Difusión del Patrimonio Intelectual. Un claro ejemplo de ello es:

  • El trabajo se ha enviado a una revista cuya política editorial permite la publicación en abierto Open Access.
[+]

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (Pedrera-Jimenez, Miguel) .

los autores responsables de establecer las labores de correspondencia han sido PEDRERA JIMÉNEZ, MIGUEL y Pedrera-Jimenez, Miguel.

[+]

Reconocimientos ligados al ítem

Ministerio de Economia y Competitividad Instituto de Salud Carlos III PI18/00981 PI18/01047 PI18CIII/00019
[+]