Nous présentons une méthodologie basée sur des capteurs multimodaux pour configurer un système simple, confortable et rapide de détection des chutes et de reconnaissance d’activité humaine. L’objectif est de construire un système de détection précise des chutes qui peut être facilement mis en œuvre et adopté.
Cet article présente une méthodologie basée sur des capteurs multimodaux pour configurer un système simple, confortable et rapide de détection des chutes et de reconnaissance d’activité humaine qui peut être facilement mis en œuvre et adopté. La méthodologie est basée sur la configuration de types spécifiques de capteurs, de méthodes et de procédures d’apprentissage automatique. Le protocole est divisé en quatre phases : (1) création de base de données (2) analyse des données (3) simplification du système et (4) évaluation. À l’aide de cette méthodologie, nous avons créé une base de données multimodale pour la détection des chutes et la reconnaissance des activités humaines, à savoir la détection UP-Fall. Il comprend des échantillons de données de 17 sujets qui effectuent 5 types de chutes et 6 activités simples différentes, au cours de 3 essais. Toutes les informations ont été recueillies à l’aide de 5 capteurs portables (accéléromètre tri-axe, gyroscope et intensité lumineuse), 1 casque d’électroencéphalographe, 6 capteurs infrarouges comme capteurs ambiants, et 2 caméras dans les points de vue latéraux et avant. La nouvelle méthodologie proposée ajoute quelques étapes importantes pour effectuer une analyse approfondie des problèmes de conception suivants afin de simplifier un système de détection des chutes : a) sélectionnez quels capteurs ou combinaison de capteurs doivent être utilisés dans un simple système de détection des chutes, b) déterminer le meilleur placement des sources d’information, et c) sélectionner la méthode de classification d’apprentissage automatique la plus appropriée pour la détection et la reconnaissance des activités humaines. Même si certaines approches multimodales rapportées dans la littérature ne se concentrent que sur une ou deux des questions mentionnées ci-dessus, notre méthodologie permet de résoudre simultanément ces trois problèmes de conception liés à une chute humaine et le système de détection et de reconnaissance d’activité.
Depuis le phénomène mondial du vieillissement de la population1, la prévalence de l’automne a augmenté et est en fait considéré comme un problème de santé majeur2. Lorsqu’une chute se produit, les gens ont besoin d’une attention immédiate afin de réduire les conséquences négatives. Les systèmes de détection des chutes peuvent réduire le temps pendant lequel une personne reçoit des soins médicaux en envoyant une alerte lorsqu’une chute se produit.
Il existe diverses catégorisations des systèmes de détection des chutes3. Les premiers travaux4 classent les systèmes de détection des chutes par leur méthode de détection, les méthodes d’analyse et les méthodes d’apprentissage automatique. Plus récemment, d’autres auteurs3,5,6 ont considéré les capteurs d’acquisition de données comme la principale caractéristique de classification des détecteurs de chute. Igual et coll.3 divisent les systèmes de détection des chutes en systèmes contextuelles, qui comprennent des approches basées sur la vision et les capteurs ambiants, et des systèmes d’appareils portables. Mubashir et coll.5 classent les détecteurs de chute en trois groupes basés sur les dispositifs utilisés pour l’acquisition de données : appareils portables, capteurs d’ambiance et dispositifs basés sur la vision. Perry et coll.6 envisagent des méthodes de mesure de l’accélération, des méthodes de mesure de l’accélération combinées à d’autres méthodes et des méthodes de non-mesure de l’accélération. À partir de ces enquêtes, nous pouvons déterminer que les capteurs et les méthodes sont les principaux éléments pour classer la stratégie générale de recherche.
Chacun des capteurs a des faiblesses et des forces discutées dans Xu et al.7. Les approches basées sur la vision utilisent principalement des caméras normales, des caméras de capteurs de profondeur et/ou des systèmes de capture de mouvement. Les caméras Web normales sont peu coûteuses et faciles à utiliser, mais elles sont sensibles aux conditions environnementales (variation de la lumière, occlusion, etc.), ne peuvent être utilisées que dans un espace réduit et avoir des problèmes de confidentialité. Les caméras de profondeur, telles que le Kinect, fournissent lemouvement 3D complet et sont moins affectées par des conditions d’éclairage que les caméras normales. Cependant, les approches basées sur le Kinect ne sont pas aussi robustes et fiables. Les systèmes de capture de mouvement sont plus coûteux et difficiles à utiliser.
Les approches basées sur les appareils accéléromètres et les téléphones intelligents/montres avec accéléromètres intégrés sont très couramment utilisées pour la détection des chutes. Le principal inconvénient de ces appareils est qu’ils doivent être portés pendant de longues périodes. L’inconfort, l’immobilité, le placement du corps et l’orientation sont des problèmes de conception à résoudre dans ces approches. Bien que les smartphones et les montres intelligentes soient des appareils moins envahissants que les capteurs, les personnes âgées oublient souvent ou ne portent pas toujours ces appareils. Néanmoins, l’avantage de ces capteurs et dispositifs est qu’ils peuvent être utilisés dans de nombreuses pièces et / ou à l’extérieur.
Certains systèmes utilisent des capteurs placés autour de l’environnement pour reconnaître les chutes/activités, de sorte que les gens n’ont pas à porter les capteurs. Cependant, ces capteurs sont également limités aux endroits où ils sont déployés8 et sont parfois difficiles à installer. Récemment, les systèmes de détection des chutes multimodales comprennent différentes combinaisons de capteurs de vision, portables et ambiants afin d’obtenir plus de précision et de robustesse. Ils peuvent également surmonter certaines des limites du capteur unique.
La méthodologie utilisée pour la détection des chutes est étroitement liée à la chaîne de reconnaissance d’activité humaine (ARC) présentée par Bulling et coll.9, qui se compose d’étapes pour l’acquisition de données, le prétraitement et la segmentation des signaux, l’extraction et la sélection des fonctionnalités, la formation et la classification. Les problèmes de conception doivent être résolus pour chacune de ces étapes. Différentes méthodes sont utilisées à chaque étape.
Nous présentons une méthodologie basée sur des capteurs multimodaux pour configurer un système simple, confortable et rapide de détection/reconnaissance d’activité humaine. L’objectif est de construire un système de détection précise des chutes qui peut être facilement mis en œuvre et adopté. La nouvelle méthodologie proposée est basée sur l’ARC, mais elle ajoute quelques phases importantes pour effectuer une analyse approfondie des questions suivantes afin de simplifier le système : a) sélectionner quels capteurs ou combinaison de capteurs doivent être utilisés dans un simple système de détection des chutes; b) déterminer le meilleur placement des sources d’information; c) sélectionnez la méthode de classification d’apprentissage automatique la plus appropriée pour la détection des chutes et la reconnaissance de l’activité humaine afin de créer un système simple.
Il ya quelques travaux connexes dans la littérature qui traitent d’un ou deux des problèmes de conception mentionnés ci-dessus, mais à notre connaissance, il n’y a pas de travail qui se concentre sur une méthodologie pour surmonter tous ces problèmes.
Les œuvres connexes utilisent des approches multimodales pour la détection des chutes et la reconnaissance de l’activité humaine10,11,12 afin d’acquérir de la robustesse et d’augmenter la précision. Kwolek et coll.10 ont proposé la conception et la mise en œuvre d’un système de détection des chutes basé sur des données accélérométriques et des cartes de profondeur. Ils ont conçu une méthodologie intéressante dans laquelle un accéléromètre à trois axes est mis en œuvre pour détecter une chute potentielle ainsi que le mouvement de la personne. Si la mesure d’accélération dépasse un seuil, l’algorithme extrait une personne différenciant la carte de profondeur de la carte de référence de profondeur mise à jour en ligne. Une analyse des combinaisons de profondeur et d’accéléromètre a été faite à l’aide d’un classificateur de machine vectorielle de soutien.
Ofli et coll.11 ont présenté une base de données multimodale d’action humaine (MHAD) afin de fournir un banc d’essai pour de nouveaux systèmes de reconnaissance d’activité humaine. Le jeu de données est important puisque les actions ont été recueillies simultanément à l’aide de 1 système de capture de mouvement optique, 4 caméras multi-vue, 1 système Kinect, 4 microphones et 6 accéléromètres sans fil. Les auteurs ont présenté des résultats pour chaque modalité : le Kinect, le mocap, l’accéléromètre et l’audio.
Dovgan et coll.12 ont proposé un prototype pour détecter le comportement anormal, y compris les chutes, chez les personnes âgées. Ils ont conçu des tests pour trois systèmes de capteurs afin de trouver l’équipement le plus approprié pour la détection de l’automne et du comportement inhabituel. La première expérience consiste en des données provenant d’un système de capteurs intelligents avec 12 étiquettes attachées aux hanches, genoux, chevilles, poignets, coudes et épaules. Ils ont également créé un jeu de données de test à l’aide d’un système de capteur Ubisense avec quatre étiquettes attachées à la taille, la poitrine et les deux chevilles, et un accéléromètre Xsens. Dans une troisième expérience, quatre sujets n’utilisent le système Ubisense que lorsqu’ils effectuent 4 types de chutes, 4 problèmes de santé comme comportement anormal et une activité différente de la vie quotidienne (ADL).
D’autres travaux dans la littérature13,14,15 traitent du problème de trouver le meilleur emplacement de capteurs ou de dispositifs pour la détection des chutes en comparant les performances de diverses combinaisons de capteurs avec plusieurs classificateurs. Santoyo et coll.13 ont présenté une évaluation systématique évaluant l’importance de l’emplacement de 5 capteurs pour la détection des chutes. Ils ont comparé les performances de ces combinaisons de capteurs à l’aide de voisins k-nearest (KNN), de machines vectorielles de soutien (SVM), de bayes naïfs (NB) et de classificateurs d’arbres de décision (DT). Ils concluent que l’emplacement du capteur sur le sujet a une influence importante sur la performance du détecteur de chute indépendamment du classificateur utilisé.
Une comparaison des placements de capteurs portables sur le corps pour la détection des chutes a été présentée par ‘zdemir14. Afin de déterminer le placement du capteur, l’auteur a analysé 31 combinaisons de capteurs des positions suivantes : tête, taille, poitrine, poignet droit, cheville droite et cuisse droite. Quatorze volontaires ont effectué 20 chutes simulées et 16 ADL. Il a constaté que la meilleure performance a été obtenue quand un seul capteur est positionné sur la taille de ces expériences de combinaison exhaustive. Une autre comparaison a été présentée par Ntanasis15 à l’aide de l’ensemble de données d’Izdemir. Les auteurs ont comparé les positions individuelles sur la tête, la poitrine, la taille, le poignet, la cheville et la cuisse à l’aide des classificateurs suivants : J48, KNN, RF, comité aléatoire (RC) et SVM.
Des points de repère de la performance de différentes méthodes de calcul pour la détection des chutes peuvent également être trouvés dans la littérature16,17,18. Bagala et coll.16 ont présenté une comparaison systématique pour comparer les performances de treize méthodes de détection des chutes testées sur des chutes réelles. Ils ne considéraient que les algorithmes basés sur des mesures d’accéléromètre placées sur la taille ou le tronc. Bourke et coll.17 ont évalué les performances de cinq algorithmes analytiques pour la détection des chutes à l’aide d’un ensemble de données de ADL et de chutes basées sur des lectures d’accéléromètres. Kerdegari18 a également fait une comparaison des performances des différents modèles de classification pour un ensemble de données d’accélération enregistrées. Les algorithmes utilisés pour la détection des chutes étaient zeroR, oneR, NB, DT, multicouche perceptron et SVM.
Une méthodologie de détection des chutes a été proposée par Alazrai et coll.18 utilisant le descripteur géométrique de pose de mouvement pour construire une représentation accumulée à base d’histogramme de l’activité humaine. Ils ont évalué le cadre à l’aide d’un jeu de données recueilli avec des capteurs Kinect.
En résumé, nous avons trouvé des travaux liés à la détection des chutes multimodales10,11,12 qui comparent les performances de différentes combinaisons de modalités. Certains auteurs abordent le problème de trouver le meilleur placement de capteurs13,14,15, ou des combinaisons de capteurs13 avec plusieurs classificateurs13,15,16 avec plusieurs capteurs de la même modalité et des accéléromètres. Aucun travail n’a été trouvé dans la littérature qui traitent le placement, les combinaisons multimodales et le point de repère de classificateur en même temps.
Il est courant de rencontrer des défis dus à la synchronisation, à l’organisation et aux problèmes d’incohérence des données20 lorsqu’un jeu de données est créé.
Synchronisation
Dans l’acquisition de données, des problèmes de synchronisation surviennent étant donné que plusieurs capteurs fonctionnent généralement à des taux d’échantillonnage différents. Les capteurs à fréquences plus élevées recueillent plus de données que celles dont les fréquences sont inférieures. Ainsi, les données provenant de différentes sources ne seront pas appariées correctement. Même si les capteurs fonctionnent aux mêmes taux d’échantillonnage, il est possible que les données ne soient pas alignées. À cet égard, les recommandations suivantes pourraient aider à gérer ces problèmes de synchronisation20: (i) enregistrer l’échéanation, le sujet, l’activité et l’essai dans chaque échantillon de données obtenu à partir des capteurs; (ii) la source d’information la plus cohérente et la moins fréquente doit être utilisée comme signal de référence pour la synchronisation; et (iii) utiliser des procédures automatiques ou semi-automatiques pour synchroniser les enregistrements vidéo que l’inspection manuelle ne serait pas pratique.
Prétaitment des données
Le prétraitage des données doit également être effectué, et les décisions critiques influencent ce processus : a) déterminer les méthodes de stockage des données et de représentation des données de sources multiples et hétérogènes b) décider des moyens de stocker des données dans l’hôte local ou sur le cloud (c) sélectionner l’organisation des données, y compris les noms de fichiers et les dossiers (d) gérer les valeurs manquantes des données ainsi que les redondances trouvées dans les capteurs , entre autres. En outre, pour le cloud des données, la mise en mémoire tampon locale est recommandée lorsque cela est possible pour atténuer la perte de données au moment du téléchargement.
Incohérence des données
L’incohérence des données est courante entre les essais qui trouvent des variations dans la taille des échantillons de données. Ces problèmes sont liés à l’acquisition de données dans des capteurs portables. De brèves interruptions de l’acquisition de données et de collision de données à partir de plusieurs capteurs entraînent des incohérences dans les données. Dans ces cas, les algorithmes de détection d’incohérence sont importants pour gérer les défaillances en ligne dans les capteurs. Il est important de souligner que les appareils sans fil doivent être surveillés fréquemment tout au long de l’expérience. Une batterie faible peut avoir un impact sur la connectivité et entraîner une perte de données.
Éthique
Le consentement à participer et l’approbation éthique sont obligatoires dans tous les types d’expérimentations où les gens sont impliqués.
En ce qui concerne les limites de cette méthodologie, il est important de noter qu’elle est conçue pour des approches qui tiennent compte des différentes modalités de collecte de données. Les systèmes peuvent inclure des capteurs portables, ambiants et/ou de vision. Il est suggéré d’examiner la consommation d’énergie des appareils et la durée de vie des batteries dans les capteurs sans fil, en raison de problèmes tels que la perte de la collecte de données, la diminution de la connectivité et la consommation d’énergie dans l’ensemble du système. En outre, cette méthodologie est destinée aux systèmes qui utilisent des méthodes d’apprentissage automatique. Une analyse de la sélection de ces modèles d’apprentissage automatique doit être effectuée à l’avance. Certains de ces modèles pourraient être précis, mais très long et d’énergie. Il faut tenir compte d’un compromis entre une estimation précise et une disponibilité limitée des ressources pour l’informatique dans les modèles d’apprentissage automatique. Il est également important de noter que, dans la collecte de données du système, les activités ont été menées dans le même ordre; aussi, les essais ont été exécutés dans la même séquence. Pour des raisons de sécurité, un matelas de protection a été utilisé pour que les sujets tombent dessus. En outre, les chutes ont été auto-initiées. Il s’agit d’une différence importante entre les chutes simulées et réelles, qui se produisent généralement vers les matériaux durs. En ce sens, ce jeu de données enregistré tombe avec une réaction intuitive essayant de ne pas tomber. En outre, il existe certaines différences entre les chutes réelles chez les personnes âgées ou handicapées et la simulation tombe; et ceux-ci doivent être pris en compte lors de la conception d’un nouveau système de détection des chutes. Cette étude a été axée sur les jeunes sans aucune déficience, mais il est remarquable de dire que la sélection des sujets devrait être alignée sur l’objectif du système et la population cible qui l’utilisera.
D’après les travaux connexes décrits au-dessusde 10,11,12,13,14,15,16,17,18, nous pouvons observer qu’il ya des auteurs qui utilisent des approches multimodales se concentrant sur l’obtention de détecteurs de chute robustes ou se concentrer sur le placement ou la performance de la classificateur. Par conséquent, ils ne traitent qu’un ou deux des problèmes de conception pour la détection des chutes. Notre méthodologie permet de résoudre simultanément trois des principaux problèmes de conception d’un système de détection des chutes.
Pour les travaux futurs, nous suggérons la conception et la mise en œuvre d’un système de détection des chutes multimodales simple basé sur les résultats obtenus suivant cette méthodologie. Pour l’adoption dans le monde réel, l’apprentissage des transferts, la classification hiérarchique et les approches d’apprentissage profond devraient être utilisés pour développer des systèmes plus robustes. Notre mise en œuvre n’a pas tenu compte des mesures qualitatives des modèles d’apprentissage automatique, mais il faut tenir compte des ressources informatiques en temps réel et limitées pour le développement de systèmes de détection/reconnaissance de la chute humaine et des activités. Enfin, afin d’améliorer notre jeu de données, des activités de trébuchement ou de chute presque et un suivi en temps réel des bénévoles au cours de leur vie quotidienne peuvent être envisagés.
The authors have nothing to disclose.
Cette recherche a été financée par Universidad Panamericana grâce à la subvention “Fomento a la Investigacion UP 2018”, selon le code du projet UP-CI-2018-ING-MX-04.
Inertial measurement wearable sensor | Mbientlab | MTH-MetaTracker | Tri-axial accelerometer, tri-axial gyroscope and light intensity wearable sensor. |
Electroencephalograph brain sensor helmet MindWave | NeuroSky | 80027-007 | Raw brainwave signal with one forehand sensor. |
LifeCam Cinema video camera | Microsoft | H5D-00002 | 2D RGB camera with USB cable interface. |
Infrared sensor | Alean | ABT-60 | Proximity sensor with normally closed relay. |
Bluetooth dongle | Mbientlab | BLE | Dongle for Bluetooth connection between the wearable sensors and a computer. |
Raspberry Pi | Raspberry | Version 3 Model B | Microcontroller for infrared sensor acquisition and computer interface. |
Personal computer | Dell | Intel Xeon E5-2630 v4 @2.20 GHz, RAM 32GB |