We presenteren een methodologie op basis van multimodale sensoren om een eenvoudig, comfortabel en snel valdetectie- en human activity recognition systeem te configureren. Het doel is om een systeem te bouwen voor nauwkeurige valdetectie die eenvoudig kan worden geïmplementeerd en aangenomen.
Dit document presenteert een methodologie op basis van multimodale sensoren om een eenvoudig, comfortabel en snel valdetectie- en human activity recognition systeem te configureren dat eenvoudig kan worden geïmplementeerd en aangenomen. De methodologie is gebaseerd op de configuratie van specifieke soorten sensoren, machine learning-methoden en procedures. Het protocol is onderverdeeld in vier fasen: (1) database creatie (2) data-analyse (3) systeemvereenvoudiging en (4) evaluatie. Met behulp van deze methodologie hebben we een multimodale database gemaakt voor valdetectie en menselijke activiteitsherkenning, namelijk UP-Fall Detection. Het bestaat uit gegevensmonsters van 17 proefpersonen die 5 soorten vallen en 6 verschillende eenvoudige activiteiten uitvoeren, tijdens 3 proeven. Alle informatie werd verzameld met behulp van 5 draagbare sensoren (tri-as versnellingsmeter, gyroscoop en lichtintensiteit), 1 elektro-encefalograaf helm, 6 infrarood sensoren als omgevingssensoren, en 2 camera’s in laterale en voorste gezichtspunten. De voorgestelde nieuwe methodologie voegt een aantal belangrijke fasen toe om een diepgaande analyse van de volgende ontwerpproblemen uit te voeren om een valdetectiesysteem te vereenvoudigen: a) selecteren welke sensoren of een combinatie van sensoren moeten worden gebruikt in een eenvoudig valdetectiesysteem, b) de beste plaatsing van de informatiebronnen bepalen, en c) de meest geschikte machine learning-classificatiemethode voor val- en menselijke activiteitsdetectie en -herkenning selecteren. Hoewel sommige multimodale benaderingen die in de literatuur worden gerapporteerd zich alleen richten op een of twee van de bovengenoemde kwesties, maakt onze methodologie het mogelijk om deze drie ontwerpproblemen in verband met een systeem voor menselijke val- en activiteitsdetectie en -herkenning tegelijkertijd op te lossen.
Sinds het wereldverschijnsel van de vergrijzing van de bevolking1, is de daling stegen en wordt het eigenlijk beschouwd als een groot gezondheidsprobleem2. Wanneer een val optreedt, mensen vereisen onmiddellijke aandacht om negatieve gevolgen te verminderen. Valdetectiesystemen kunnen de hoeveelheid tijd verkorten waarin een persoon medische hulp krijgt bij het verzenden van een waarschuwing wanneer een val optreedt.
Er zijn verschillende categorisaties van valdetectiesystemen3. Vroege werken4 classificeren valdetectiesystemen op basis van hun detectiemethode, ruwweg analytische methoden en machine learning-methoden. Meer recent, andere auteurs3,5,6 hebben beschouwd data-acquisitie sensoren als de belangrijkste functie om val detectoren classificeren. Igual et al.3 verdeelt valdetectiesystemen in contextbewuste systemen, waaronder op visie en omgevingssensoren gebaseerde benaderingen en draagbare apparaatsystemen. Mubashir et al.5 classificeert valdetectoren in drie groepen op basis van de apparaten die worden gebruikt voor gegevensverwerving: draagbare apparaten, sfeersensoren en op visie gebaseerde apparaten. Perry et al.6 houdt rekening met methoden voor het meten van versnelling, methoden voor het meten van versnelling in combinatie met andere methoden, en methoden die geen versnelling meten. Uit deze enquêtes kunnen we vaststellen dat sensoren en methoden de belangrijkste elementen zijn om de algemene onderzoeksstrategie te classificeren.
Elk van de sensoren heeft zwakke punten en sterke punten besproken in Xu et al.7. Vision-gebaseerde benaderingen maken voornamelijk gebruik van normale camera’s, dieptesensorcamera’s en/of motion capture-systemen. Normale webcamera’s zijn goedkoop en gemakkelijk te gebruiken, maar ze zijn gevoelig voor omgevingsomstandigheden (lichtvariatie, occlusie, enz.), kunnen alleen worden gebruikt in een beperkte ruimte en hebben privacyproblemen. Dieptecamera’s, zoals de Kinect, bieden full-body 3D-beweging7 en hebben minder last van lichtomstandigheden dan normale camera’s. Benaderingen op basis van de Kinect zijn echter niet zo robuust en betrouwbaar. Motion capture systemen zijn duurder en moeilijk te gebruiken.
Benaderingen op basis van versnellingsmeter apparaten en smartphones / horloges met ingebouwde versnellingsmeters worden zeer vaak gebruikt voor valdetectie. Het belangrijkste nadeel van deze apparaten is dat ze moeten worden gedragen voor lange periodes. Ongemak, opdringerigheid, plaatsing van het lichaam en oriëntatie zijn ontwerpproblemen die in deze benaderingen moeten worden opgelost. Hoewel smartphones en slimme horloges minder opdringerige apparaten zijn die sensoren, vergeten oudere mensen deze apparaten vaak of niet altijd. Het voordeel van deze sensoren en apparaten is echter dat ze in veel ruimtes en/of buiten kunnen worden gebruikt.
Sommige systemen maken gebruik van sensoren geplaatst rond de omgeving om vallen / activiteiten te herkennen, zodat mensen niet hoeven te dragen van de sensoren. Deze sensoren zijn echter ook beperkt tot de plaatsen waar ze worden ingezet8 en zijn soms moeilijk te installeren. Onlangs omvatten multimodale valdetectiesystemen verschillende combinaties van visie,draagbare en omgevingssensoren om meer precisie en robuustheid te verkrijgen. Ze kunnen ook een aantal van de enkele sensor beperkingen te overwinnen.
De methodologie die wordt gebruikt voor valdetectie is nauw verwant aan de human activity recognition chain (ARC) gepresenteerd door Bulling et al.9, die bestaat uit fasen voor gegevensverwerving, signaalvoorbewerking en segmentatie, feature extraction en selectie, training en classificatie. Ontwerpproblemen moeten voor elk van deze fasen worden opgelost. In elke fase worden verschillende methoden gebruikt.
We presenteren een methodologie op basis van multimodale sensoren om een eenvoudig, comfortabel en snel menselijke val- en menselijke activiteitsdetectie/herkenningssysteem te configureren. Het doel is om een systeem te bouwen voor nauwkeurige valdetectie die eenvoudig kan worden geïmplementeerd en aangenomen. De voorgestelde nieuwe methodologie is gebaseerd op ARC, maar voegt een aantal belangrijke fasen toe om een diepgaande analyse van de volgende problemen uit te voeren om het systeem te vereenvoudigen: a) selecteer welke sensoren of combinatie van sensoren in een eenvoudig valdetectiesysteem moeten worden gebruikt; b) de beste plaatsing van de informatiebronnen te bepalen ; en (c) de meest geschikte machine learning-classificatiemethode voor valdetectie en menselijke activiteitsherkenning selecteren om een eenvoudig systeem te creëren.
Er zijn een aantal verwante werken in de literatuur die een of twee van de bovengenoemde ontwerpproblemen aanpakken, maar voor zover wij weten, is er geen werk dat zich richt op een methodologie om al deze problemen te overwinnen.
Gerelateerde werken gebruiken multimodale benaderingen voor valdetectie en menselijke activiteitsherkenning10,11,12 om robuustheid te verkrijgen en de precisie te verhogen. Kwolek et al.10 stelde het ontwerp en de implementatie voor van een valdetectiesysteem op basis van versnellingsgegevens en dieptekaarten. Ze ontwierpen een interessante methodologie waarin een drie-assige versnellingsmeter wordt geïmplementeerd om een mogelijke val en de beweging van de persoon te detecteren. Als de versnellingsmeting een drempelwaarde overschrijdt, haalt het algoritme een persoon uit die de dieptekaart onderscheidt van de online bijgewerkte dieptereferentiekaart. Een analyse van diepte en versnellingsmeter combinaties werd gemaakt met behulp van een ondersteuning vector machine classifier.
Ofli et al.11 presenteerde een Multimodal Human Action Database (MHAD) om een testbed te bieden voor nieuwe systemen voor de erkenning van menselijke activiteiten. De dataset is belangrijk omdat de acties gelijktijdig werden verzameld met behulp van 1 optisch motion capture systeem, 4 multi-view camera’s, 1 Kinect systeem, 4 microfoons en 6 draadloze versnellingsmeters. De auteurs presenteerden resultaten voor elke modaliteit: de Kinect, de mocap, de versnellingsmeter en de audio.
Dovgan et al.12 stelden een prototype voor voor het opsporen van afwijkend gedrag, inclusief vallen, bij ouderen. Ze ontwierpen tests voor drie sensorsystemen om de meest geschikte apparatuur te vinden voor val- en detectie van ongewoon gedrag. Het eerste experiment bestaat uit gegevens van een slim sensorsysteem met 12 tags aan de heupen, knieën, enkels, polsen, ellebogen en schouders. Ze creëerden ook een test dataset met behulp van een Ubisense sensor systeem met vier tags bevestigd aan de taille, borst en beide enkels, en een Xsens versnellingsmeter. In een derde experiment gebruiken vier proefpersonen alleen het Ubisense-systeem tijdens het uitvoeren van 4 soorten vallen, 4 gezondheidsproblemen als afwijkend gedrag en verschillende activiteit van het dagelijks leven (ADL).
Andere werken in literatuur13,14,15 pakken het probleem van het vinden van de beste plaatsing van sensoren of apparaten voor valdetectie vergelijken van de prestaties van verschillende combinaties van sensoren met verschillende classificeerders. Santoyo et al.13 presenteerdeeen systematische beoordeling van het belang van de locatie van 5 sensoren voor valdetectie. Ze vergeleken de prestaties van deze sensorcombinaties met behulp van k-nearest neighbors (KNN), support vector machines (SVM), naïeve Bayes (NB) en decision tree (DT) classifiers. Zij concluderen dat de locatie van de sensor op het onderwerp heeft een belangrijke invloed op de valdetector prestaties onafhankelijk van de gebruikte classificatie.
Een vergelijking van draagbare sensor plaatsingen op het lichaam voor valdetectie werd gepresenteerd door Özdemir14. Om de plaatsing van de sensor te bepalen, analyseerde de auteur 31 sensorcombinaties van de volgende posities: hoofd, taille, borst, rechterpols, rechterenkel en rechterdij. Veertien vrijwilligers voerden 20 gesimuleerde valpartijen en 16 ADL uit. Hij vond dat de beste prestaties werd verkregen wanneer een enkele sensor is gepositioneerd op de taille van deze uitputtende combinatie experimenten. Een andere vergelijking werd gepresenteerd door Ntanasis15 met behulp van özdemir’s dataset. De auteurs vergeleken enkele posities op hoofd, borst, taille, pols, enkel en dij met behulp van de volgende classifiers: J48, KNN, RF, random committee (RC) en SVM.
Benchmarks van de prestaties van verschillende rekenmethoden voor valdetectie zijn ook te vinden in literatuur16,17,18. Bagala et al.16 presenteerde een systematische vergelijking om de prestaties van dertien valdetectiemethoden die op echte vallen zijn getest, te benchmarken. Ze beschouwden alleen algoritmen op basis van versnellingsmeter metingen geplaatst op de taille of romp. Bourke et al.17 evalueerden de prestaties van vijf analytische algoritmen voor valdetectie met behulp van een dataset van ACL’s en valpartijen op basis van versnellingsmetermetingen. Kerdegari18 maakte ook een vergelijking van de prestaties van verschillende classificatiemodellen voor een reeks geregistreerde versnellingsgegevens. De algoritmen die worden gebruikt voor valdetectie waren zeroR, oneR, NB, DT, multilayer perceptron en SVM.
Een methodologie voor valdetectie werd voorgesteld door Alazrai et al.18 met behulp van motion pose geometrische descriptor om een geaccumuleerde histogram-gebaseerde vertegenwoordiging van menselijke activiteit te construeren. Ze evalueerden het framework met behulp van een dataset verzameld met Kinect-sensoren.
Samengevat vonden we multimodale valdetectie gerelateerde werken10,11,12 die de prestaties van verschillende combinaties van modaliteiten vergelijken. Sommige auteurs pakken het probleem van het vinden van de beste plaatsing van sensoren13,14,15, of combinaties van sensoren13 met verschillende classifiers13,15,16 met meerdere sensoren van dezelfde modaliteit en versnellingsmeters. Er werd geen werk gevonden in de literatuur dat betrekking heeft op plaatsing, multimodale combinaties en classifier benchmark op hetzelfde moment.
Het is gebruikelijk om uitdagingen tegen te komen als gevolg van synchronisatie, organisatie- en gegevensinconsistentieproblemen20 wanneer een gegevensset wordt gemaakt.
Synchronisatie
Bij het verkrijgen van gegevens ontstaan synchronisatieproblemen, aangezien meerdere sensoren vaak op verschillende samplingsnelheden werken. Sensoren met hogere frequenties verzamelen meer gegevens dan die met lagere frequenties. Gegevens uit verschillende bronnen worden dus niet correct gekoppeld. Zelfs als sensoren met dezelfde bemonsteringssnelheden werken, is het mogelijk dat de gegevens niet worden uitgelijnd. In dit verband kunnen de volgende aanbevelingen helpen om deze synchronisatieproblemen aan te pakken20: i) registertijdstempel, onderwerp, activiteit en proef in elk gegevensmonster dat bij de sensoren is verkregen; ii) de meest consistente en minder frequente informatiebron moet worden gebruikt als referentiesignaal voor synchronisatie; en (iii) automatische of semi-automatische procedures gebruiken om video-opnamen te synchroniseren die handmatige inspectie onpraktisch zou zijn.
Gegevens voorverwerking
Er moet ook sprake zijn van voorverwerking van gegevens en kritische beslissingen zijn van invloed op dit proces: (a) bepalen de methoden voor gegevensopslag en gegevensrepresentatie van meerdere en heterogene bronnen (b) bepalen welke manieren om gegevens op te slaan in de lokale host of in de cloud (c) de organisatie van gegevens selecteren, inclusief de bestandsnamen en mappen (d) omgaan met ontbrekende waarden van gegevens en redundantie in de sensoren , o.a. Bovendien wordt voor de datacloud aanbevolen om waar mogelijk lokale buffering te beperken om het verlies van gegevens tijdens het uploaden te beperken.
Inconsistentie in gegevens
Gegevensinconsistentie komt vaak voor tussen proeven waarbij variaties in de grootte van gegevensmonsters worden gevonden. Deze problemen houden verband met data-acquisitie in draagbare sensoren. Korte onderbrekingen van gegevensverwerving en gegevensbotsing van meerdere sensoren leiden tot gegevensinconsistenties. In deze gevallen zijn inconsistentiedetectiealgoritmen belangrijk om online storingen in sensoren aan te pakken. Het is belangrijk om te benadrukken dat draadloze apparaten tijdens het experiment regelmatig moeten worden gecontroleerd. Een lage batterij kan van invloed zijn op de connectiviteit en leiden tot verlies van gegevens.
Ethische
Toestemming om deel te nemen en ethische goedkeuring zijn verplicht bij elk type experiment waarbij mensen betrokken zijn.
Met betrekking tot de beperkingen van deze methode, is het belangrijk op te merken dat het is ontworpen voor benaderingen die verschillende modaliteiten voor het verzamelen van gegevens overwegen. De systemen kunnen draagbare, omgevings- en/of zichtsensoren bevatten. Er wordt voorgesteld om rekening te houden met het stroomverbruik van apparaten en de levensduur van batterijen in draadloze sensoren, als gevolg van de problemen zoals verlies van gegevensverzameling, afnemende connectiviteit en stroomverbruik in het hele systeem. Bovendien is deze methode bedoeld voor systemen die machine learning-methoden gebruiken. Een analyse van de selectie van deze machine learning modellen moet vooraf worden gedaan. Sommige van deze modellen kunnen nauwkeurig zijn, maar zeer tijdrovend. Er moet rekening worden gehouden met een afweging tussen nauwkeurige schatting en beperkte beschikbaarheid van hulpbronnen voor computergebruik in machine learning-modellen. Het is ook belangrijk op te merken dat bij het verzamelen van gegevens van het systeem de activiteiten in dezelfde volgorde werden uitgevoerd; ook werden proeven uitgevoerd in dezelfde volgorde. Om veiligheidsredenen werd een beschermende matras gebruikt om op te vallen. Bovendien werden de watervallen zelf-inwerking gesteld. Dit is een belangrijk verschil tussen gesimuleerde en echte valpartijen, die over het algemeen optreden in de richting van harde materialen. In die zin valt deze opgenomen dataset met een intuïtieve reactie die probeert niet te vallen. Bovendien zijn er enkele verschillen tussen echte valpartijen bij ouderen of mensen met een handicap en valt de simulatie; en hiermee moet rekening worden gehouden bij het ontwerpen van een nieuw valdetectiesysteem. Deze studie was gericht op jongeren zonder enige beperking, maar het is opmerkelijk om te zeggen dat de selectie van onderwerpen moet worden afgestemd op het doel van het systeem en de doelgroep die het zal gebruiken.
Uit de verwante werken beschreven boven10,11,1212,13,14,15,16,17,18, kunnen we vaststellen dat er auteurs zijn die gebruik maken van multimodale benaderingen gericht op het verkrijgen van robuuste val detectoren of zich richten op plaatsing of prestaties van de classificatie. Vandaar, ze alleen een of twee van de ontwerpproblemen voor valdetectie. Onze methodologie maakt het mogelijk om tegelijkertijd drie van de belangrijkste ontwerpproblemen van een valdetectiesysteem op te lossen.
Voor toekomstig werk stellen we voor om een eenvoudig multimodaal valdetectiesysteem te ontwerpen en te implementeren op basis van de bevindingen die volgens deze methodologie zijn verkregen. Voor de invoering in de praktijk moeten overdrachtsleer, hiërarchische classificatie en deep learning-benaderingen worden gebruikt voor de ontwikkeling van robuustere systemen. Onze implementatie hield geen rekening met kwalitatieve statistieken van de machine learning-modellen, maar er moet rekening worden gehouden met real-time en beperkte computerbronnen voor de verdere ontwikkeling van menselijke val- en activiteitsdetectie-/herkenningssystemen. Ten slotte, om onze dataset te verbeteren, struikelen of bijna dalende activiteiten en real-time monitoring van vrijwilligers tijdens hun dagelijks leven kan worden overwogen.
The authors have nothing to disclose.
Dit onderzoek is gefinancierd door Universidad Panamericana via de subsidie “Fomento a la Investigación UP 2018”, onder projectcode UP-CI-2018-ING-MX-04.
Inertial measurement wearable sensor | Mbientlab | MTH-MetaTracker | Tri-axial accelerometer, tri-axial gyroscope and light intensity wearable sensor. |
Electroencephalograph brain sensor helmet MindWave | NeuroSky | 80027-007 | Raw brainwave signal with one forehand sensor. |
LifeCam Cinema video camera | Microsoft | H5D-00002 | 2D RGB camera with USB cable interface. |
Infrared sensor | Alean | ABT-60 | Proximity sensor with normally closed relay. |
Bluetooth dongle | Mbientlab | BLE | Dongle for Bluetooth connection between the wearable sensors and a computer. |
Raspberry Pi | Raspberry | Version 3 Model B | Microcontroller for infrared sensor acquisition and computer interface. |
Personal computer | Dell | Intel Xeon E5-2630 v4 @2.20 GHz, RAM 32GB |