Accuracy Comparison of CNN, LSTM, and Transformer for Activity Recognition Using IMU and Visual Markers

Bookmark (0)
Please login to bookmark Close

“El reconocimiento de la actividad humana (HAR) tiene aplicaciones que van desde la seguridad hasta la atención sanitaria. Por lo general, estos sistemas se componen de modelos de adquisición de datos y reconocimiento de actividad. En este trabajo, comparamos la precisión de dos sistemas de adquisición: Unidades de Medición Inercial (IMUs) vs Sistemas de Análisis de Movimiento (MAS). Entrenamos modelos para reconocer ejercicios de brazos utilizando aprendizaje profundo de última generación arquitecturas y comparó su precisión. MAS utiliza un conjunto de cámaras y marcadores reflectantes. IMU utiliza acelerómetros, giroscopios y magnetómetros. Los sensores de ambos sistemas se colocaron en diferentes ubicaciones de la extremidad superior. Capturamos y anotamos 3 conjuntos de datos, cada uno utilizando ambos sistemas simultáneamente. Para el reconocimiento de actividades, entrenamos 8 arquitecturas, cada una con diferentes operaciones y configuraciones de capas. Las mejores arquitecturas fueron una combinación de CNN, LSTM y Transformer, logrando una precisión de prueba del 89% al 99% en promedio. Evaluamos cómo la selección de características redujo los sensores necesarios. Encontramos que los datos de IMU y MAS fueron capaces de distinguir correctamente los ejercicios de brazo. Al principio, las capas de CNN producían una mayor precisión en conjuntos de datos difíciles. La IMU tenía ventajas sobre otros sistemas de adquisición para el reconocimiento de actividades. Analizamos las relaciones entre la precisión de los modelos, las formas de onda de la señal, la correlación de las señales, la frecuencia de muestreo, la duración del ejercicio y el tamaño de la ventana. Finalmente, se propuso el uso de una única IMU ubicada en la muñeca y una extracción de ventana de tamaño variable.”

​”El reconocimiento de la actividad humana (HAR) tiene aplicaciones que van desde la seguridad hasta la atención sanitaria. Por lo general, estos sistemas se componen de modelos de adquisición de datos y reconocimiento de actividad. En este trabajo, comparamos la precisión de dos sistemas de adquisición: Unidades de Medición Inercial (IMUs) vs Sistemas de Análisis de Movimiento (MAS). Entrenamos modelos para reconocer ejercicios de brazos utilizando aprendizaje profundo de última generación arquitecturas y comparó su precisión. MAS utiliza un conjunto de cámaras y marcadores reflectantes. IMU utiliza acelerómetros, giroscopios y magnetómetros. Los sensores de ambos sistemas se colocaron en diferentes ubicaciones de la extremidad superior. Capturamos y anotamos 3 conjuntos de datos, cada uno utilizando ambos sistemas simultáneamente. Para el reconocimiento de actividades, entrenamos 8 arquitecturas, cada una con diferentes operaciones y configuraciones de capas. Las mejores arquitecturas fueron una combinación de CNN, LSTM y Transformer, logrando una precisión de prueba del 89% al 99% en promedio. Evaluamos cómo la selección de características redujo los sensores necesarios. Encontramos que los datos de IMU y MAS fueron capaces de distinguir correctamente los ejercicios de brazo. Al principio, las capas de CNN producían una mayor precisión en conjuntos de datos difíciles. La IMU tenía ventajas sobre otros sistemas de adquisición para el reconocimiento de actividades. Analizamos las relaciones entre la precisión de los modelos, las formas de onda de la señal, la correlación de las señales, la frecuencia de muestreo, la duración del ejercicio y el tamaño de la ventana. Finalmente, se propuso el uso de una única IMU ubicada en la muñeca y una extracción de ventana de tamaño variable.” Read More