{rfName}
Mu

Llicència i ús

Altmetrics

Grant support

This work was supported by the Spanish Ministry of Economy and Competitiveness, project TIN2016-75982-C2-2-R. Jose M. Buenaposada was also partially funded by the Comunidad de Madrid project RoboCity2030-DIH-CM (S2018/NMT-4331). The authors would like to thank the anonymous reviewers for their comments and Felix Kuhnke for his help in interpreting Biwi annotations.

Anàlisi d'autories institucional

Valle, RAutor o coautorBaumela, LAutor o coautor

Compartir

Publicacions
>
Article

Multi-Task Head Pose Estimation in-the-Wild

Publicat a:Ieee Transactions On Pattern Analysis And Machine Intelligence. 43 (8): 2874-2881 - 2021-08-01 43(8), DOI: 10.1109/TPAMI.2020.3046323

Autors: Valle, Roberto; Buenaposada, Jose M; Baumela, Luis

Afiliacions

Resum

We present a deep learning-based multi-task approach for head pose estimation in images. We contribute with a network architecture and training strategy that harness the strong dependencies among face pose, alignment and visibility, to produce a top performing model for all three tasks. Our architecture is an encoder-decoder CNN with residual blocks and lateral skip connections. We show that the combination of head pose estimation and landmark-based face alignment significantly improve the performance of the former task. Further, the location of the pose task at the bottleneck layer, at the end of the encoder, and that of tasks depending on spatial information, such as visibility and alignment, in the final decoder layer, also contribute to increase the final performance. In the experiments conducted the proposed model outperforms the state-of-the-art in the face pose and visibility tasks. By including a final landmark regression step it also produces face alignment results on par with the state-of-the-art.

Paraules clau

AlgorithmAlgorithmsAlignmentDecodingDeep learningEncoder-decoderFaceFace alignmentFace poseFace recognitionFacesHead pose estimationImage processingImage processing, computer-assistedMagnetic headsMulti-task learningNetwork architectureNeural networks, computerOcclusions detectionPose estimationSignal encodingSpatial informationsState of the artTask analysisTrainingTraining strategyVisibility

Indicis de qualitat

Impacte bibliomètric. Anàlisi de la contribució i canal de difusió

El treball ha estat publicat a la revista Ieee Transactions On Pattern Analysis And Machine Intelligence a causa de la seva progressió i el bon impacte que ha aconseguit en els últims anys, segons l'agència WoS (JCR), s'ha convertit en una referència en el seu camp. A l'any de publicació del treball, 2021, es trobava a la posició 2/276, aconseguint així situar-se com a revista Q1 (Primer Cuartil), en la categoria Engineering, Electrical & Electronic. Destacable, igualment, el fet que la revista està posicionada per sobre del Percentil 90.

Des d'una perspectiva relativa, i tenint en compte l'indicador de impacte normalitzat calculat a partir de les Citacions Mundials proporcionades per WoS (ESI, Clarivate), proporciona un valor per a la normalització de citacions relatives a la taxa de citació esperada de: 1.79. Això indica que, comparat amb treballs en la mateixa disciplina i en el mateix any de publicació, el situa com un treball citat per sobre de la mitjana. (font consultada: ESI 14 Nov 2024)

Aquesta informació es reforça amb altres indicadors del mateix tipus, que encara que dinàmics en el temps i dependents del conjunt de citacions mitjanes mundials en el moment del seu càlcul, coincideixen a posicionar en algun moment el treball, entre el 50% més citats dins de la seva temàtica:

  • Mitjana Ponderada de l'Impacte Normalitzat de l'agència Scopus: 2.38 (font consultada: FECYT Febr 2024)
  • Field Citation Ratio (FCR) de la font Dimensions: 21.3 (font consultada: Dimensions Jun 2025)

Concretament, i atenent a les diferents agències d'indexació, aquest treball ha acumulat, fins a la data 2025-06-01, el següent nombre de cites:

  • WoS: 37
  • Scopus: 56
  • Europe PMC: 3
  • OpenCitations: 49

Impacte i visibilitat social

Des de la dimensió d'influència o adopció social, i prenent com a base les mètriques associades a les mencions i interaccions proporcionades per agències especialitzades en el càlcul de les denominades "Mètriques Alternatives o Socials", podem destacar a data 2025-06-01:

  • L'ús, des de l'àmbit acadèmic evidenciat per l'indicador de l'agència Altmetric referit com a agregacions realitzades pel gestor bibliogràfic personal Mendeley, ens dona un total de: 65.
  • L'ús d'aquesta aportació en marcadors, bifurcacions de codi, afegits a llistes de favorits per a una lectura recurrent, així com visualitzacions generals, indica que algú està fent servir la publicació com a base del seu treball actual. Això pot ser un indicador destacat de futures cites més formals i acadèmiques. Aquesta afirmació està avalada pel resultat de l'indicador "Capture", que aporta un total de: 65 (PlumX).

Amb una intenció més de divulgació i orientada a audiències més generals, podem observar altres puntuacions més globals com:

  • El Puntuació total de Altmetric: 1.75.
  • El nombre de mencions a la xarxa social X (abans Twitter): 4 (Altmetric).

És fonamental presentar evidències que recolzin l'alineació plena amb els principis i directrius institucionals sobre Ciència Oberta i la Conservació i Difusió del Patrimoni Intel·lectual. Un clar exemple d'això és:

  • El treball s'ha enviat a una revista la política editorial de la qual permet la publicació en obert Open Access.

Anàlisi del lideratge dels autors institucionals

Hi ha un lideratge significatiu, ja que alguns dels autors pertanyents a la institució apareixen com a primer o últim signant, es pot apreciar en el detall: Primer Autor (VALLE FERNáNDEZ, ROBERTO) i Últim Autor (BAUMELA MOLINA, LUIS).