Visión Artificial aplicada a la actividad física
En la actualidad, es un hecho aceptado por la comunidad científica, que la actividad física tiene efectos beneficiosos que ayudan a mejorar nuestro bienestar en todas las etapas de nuestra vida y, en particular, mitiga los signos del envejecimiento. Por ejemplo, la actividad física regular retrasa el decaimiento de la capacidad pulmonar [Burtscher et al., 2022] y también ayuda a prevenir e, incluso, revertir la pérdida de masa muscular [ABC-link]. La biomecánica del aparato locomotor es un área de conocimiento científico que se ocupa del estudio del movimiento humano desde una perspectiva interdisciplinar [Gianikellis et al., 2002]. Entre sus objetivos se encuentran, entender el comportamiento del aparato locomotor humano, prevenir lesiones, mejorar la técnica de ejecución de gestos deportivos, entre otros [Gianikellis et al., 2002], y encuentra aplicación en diferentes ámbitos, como el laboral, el deportivo, o el recreativo.
En el estudio del movimiento humano, la primera etapa consiste en la captura de datos a través de una gran variedad de sistemas de medición, entre los que destacan las técnicas basadas en el análisis de la imagen. El área de la Visión Artificial y el análisis de la imagen ha experimentado una revolución espectacular en los últimos años, como consecuencia de la aplicación de avances metodológicos muy significativos que se han producido en el ámbito de la Inteligencia Artificial y el Aprendizaje Automático [Stanford-Link]. En la actualidad, estos métodos permiten diseñar y construir sistemas de Visión Artificial capaces de resolver problemas del mundo real que, pocos años atrás, eran inabordables con las técnicas existentes. En particular, los sistemas de captura de movimiento se han beneficiado enormemente de esta revolución. Tanto es así que, en la actualidad, se dispone de sistemas de bajo coste que permiten automatizar la captura del movimiento humano [XNeck-link] a través de una cámara [Ramírez et al. 2020], un conjunto de ellas [Nuñez et al., 2019], o dispositivos RGBD, que capturan simultáneamente una imagen y la profundidad a la que se encuentran los objetos de la escena. En el grupo de Computación Avanzada Percepción y Optimización (CAPO) de la Universidad Rey Juan Carlos (URJC) tenemos una amplia trayectoria a nuestras espaldas investigando en sistemas de visión artificial aplicados a la captura del movimiento humano y sus aplicaciones. Esta labor investigadora ha producido frutos en forma de prototipos de diversa índole, aplicables a la captura del movimiento humano en el ámbito de la actividad física. En [Nuñez et al., 2017] se propone un sistema de captura de movimiento humano utilizando varios sensores de tipo RGBD. Cada uno de los sensores proporciona una propuesta de pose en forma de modelo articulado.
A continuación, un método de fusión de información combina de manera efectiva la información procedente de los sensores en tiempo real para proponer una pose mejorada (ver Figura 1). En [Núñez et al., 2019] perseguimos el mismo objetivo, pero utilizando como entrada del sistema múltiples cámaras. El sistema propone una pose en 2D para cada una de las imágenes recibidas de las cámaras y, posteriormente, un sistema basado en aprendizaje automático, integra toda esta información para estimar la pose del sujeto en 3D a lo largo del tiempo (en la Figura 2 se muestra un esquema de la propuesta). En [Ramírez et al., 2020] fuimos un paso más allá, abordando un problema muy complejo: estimar la pose del sujeto en 3D a partir de una sola imagen en 2D. Este problema es difícil porque no se dispone de la información completa, ya que una sola imagen proporciona información en dos dimensiones y perseguimos estimar la pose en tres dimensiones. Para ello, diseñamos y entrenamos un sistema de aprendizaje automático y los resultados obtenidos fueron muy prometedores (ver la Figura 3).
Figura 1: Esquema del modelo de seguimiento de movimiento articulado con múltiples dispositivos RGBD propuesto en [Nuñez et al., 2017]
Figura 2: Esquema del modelo de seguimiento de movimiento articulado con múltiples cámaras, propuesto en [Nuñez et al., 2019]
Figura 3: Resultados obtenidos con el sistema de captura de movimiento con una sola cámara, propuesto en [Ramírez et al., 2020]. Para cada imagen (izquierda), se muestra la salida de nuestro sistema (central) y la pose real (derecha).
Una vez realizada la captura automática de la pose del sujeto a lo largo del tiempo, esta información se puede utilizar para diferentes fines. Por ejemplo, en [Núñez et al., 2018] se propone un sistema que, a partir de una secuencia temporal de poses del sujeto, reconoce la actividad que está desarrollando. En el ámbito específico de los sistemas de ayuda aplicados a la actividad física, en [Rivero FJ, 2013] se propuso un prototipo de entrenador virtual para monitorizar la ejecución correcta de un determinado ejercicio físico. Es bien sabido que una mala técnica en la ejecución de un ejercicio puede reducir el beneficio asociado al mismo y conducir a la aparición de lesiones. El prototipo de entrenador virtual utiliza un dispositivo RGBD para capturar la pose de un sujeto realizando ejercicio. A partir de esta pose, reconoce el ejercicio que está desarrollando y vigila que la ejecución sea correcta. En el caso de que detecte una mala técnica, propone al usuario acciones concretas para corregir la ejecución (en el vídeo adjunto se muestra una demostración de funcionamiento del prototipo de entrenador virtual). En consecuencia, estos sistemas son lo suficientemente generales para extender su uso a un rango más amplio de aplicaciones como, por ejemplo, la supervisión automatizada en un proceso de rehabilitación o la evaluación del progreso en una actividad a lo largo del tiempo.
En definitiva, los avances tecnológicos actuales están propiciando un cambio revolucionario en nuestro modo de vida y la forma en la que interactuamos con nuestro entorno. En concreto, en el ámbito de la actividad física, en los últimos años han aparecido una multitud de sistemas de entrenamiento que ayudan a planificar el entrenamiento según nuestros objetivos. Desde el punto de vista tecnológico, estamos preparados para dar un salto más, consistente en desarrollar sistemas que monitoricen la ejecución correcta de los ejercicios para maximizar el beneficio, reduciendo la posibilidad de aparición de lesiones.
Referencias:
[ABC-link] https://www.abc.es/salud/enfermedades/abci-si-perdida-masa-muscular-env…
[Burtscher et al., 2002] Burtscher, J., Millet, G.P., Gatterer, H. et al. “Does Regular Physical Activity Mitigate the Age-Associated Decline in Pulmonary Function?”. Sports Medicine 52, 963–970 (2022)
[Gianikellis et al., 2002] Gianikellis K, Pantrigo JJ, Bote A, Vara A. “El desarrollo del paquete BiomSoft y sus aplicaciones en el análisis biomecánico del movimiento humano”. Biomecánica, 10 (2) 38–43 (2002)
[Stanford-Link] https://www.gsb.stanford.edu/insights/andrew-ng-why-ai-new-electricity
[XNect-link] https://vcai.mpi-inf.mpg.de/projects/XNect/
[Ramírez et al. 2020] Ramírez I, Cuesta A, Schiavi E, Pantrigo JJ. "Bayesian Capsule Networks for 3D human pose estimation from single 2D images". Neurocomputing, 379:64-73 (2020)
[Nuñez et al., 2019] Nuñez JC, Cabido R, Velez, J, Montemayor AS, Pantrigo JJ. "Multiview 3D human pose estimation using improved least-squares and LSTM networks". Neurocomputing, 323:335-343 (2019).
[Nuñez et al., 2017] Nuñez JC, Cabido R, Montemayor AS, Pantrigo JJ. "Real-time human body tracking based on data fusion from multiple RGB-D sensors". Multimedia Tools and Applications 76(3): 4249–4271 (2017).
[Nuñez et al., 2018] Nuñez-Moreno JC, Cabido R, Pantrigo JJ, Montemayor AS, Vélez J. "Convolutional Neural Networks and Long Short-Term Memory for Skeleton-Based Human Activity and Hand Gesture Recognition". Pattern Recognition. 76C: 80-94 (2018).
[Rivero FJ, 2013] Reconocimiento y corrección de actividades físicas con Kinect. Trabajo de Fin de Máster del Máster Oficial en Visión Artificial de la URJC (2013)