Nous démontrons comment déployer un système de calcul et d’alerte en temps réel des risques de psychose basé sur CogStack, une plateforme de récupération d’informations et d’extraction pour les dossiers de santé électroniques.
Des études récentes ont montré qu’une calculatrice de risque automatisée, inclusive, transdiagnostique et cliniquement basée fournit un système puissant pour soutenir la détection précoce des personnes à risque de psychose à grande échelle, en tirant parti des dossiers de santé électroniques (DSE). Cette calculatrice de risque a été validée à l’externe deux fois et fait l’objet d’essais de faisabilité pour la mise en œuvre clinique. L’intégration de cette calculatrice de risque dans la routine clinique devrait être facilitée par des études de faisabilité prospectives, qui sont nécessaires pour relever des défis pragmatiques, tels que les données manquantes, et la facilité d’utilisation de cette calculatrice de risque dans un contexte clinique réel et de routine. Ici, nous présentons une approche pour une mise en œuvre éventuelle d’un service de détection et d’alerte en temps réel des risques de psychose dans un système de DSE dans le monde réel. Cette méthode tire parti de la plate-forme CogStack, qui est un système de récupération d’informations et de récupération d’informations open-source, léger et distribué. La plate-forme CogStack intègre un ensemble de services qui permettent une recherche en texte intégral des données cliniques, un calcul en temps réel de la durée de vie et du risque de psychose, une alerte précoce au risque aux cliniciens et la surveillance visuelle des patients au fil du temps. Notre méthode comprend : 1) l’ingestion et la synchronisation des données provenant de sources multiples dans la plate-forme CogStack, 2) la mise en œuvre d’une calculatrice de risque, dont l’algorithme a déjà été développé et validé, pour le calcul en temps opportun du risque de psychose d’un patient, 3) la création de visualisations interactives et de tableaux de bord pour surveiller l’état de santé des patients au fil du temps, et 4) la construction de systèmes d’alerte automatisés pour s’assurer que les cliniciens sont avisés des patients à risque , afin que des actions appropriées puissent être poursuivies. Il s’agit de la toute première étude qui a mis au point et mis en œuvre un système de détection et d’alerte similaire dans la routine clinique pour la détection précoce de la psychose.
Les troubles psychotiques sont de graves maladies mentales qui conduisent à des difficultés à distinguer entre l’expérience interne de l’esprit et la réalité externe de l’environnement1, ainsi qu’un risque plus élevé que la moyenne d’automutilation et de suicide2. Dans le cadre des soins standard, ces troubles ont un impact majeur sur la santé publique, avec un fardeau important pour la santé et l’économie pour les individus, les familles et les sociétés du monde entier3. Les interventions précoces en psychose peuvent améliorer les résultats de ce trouble mental4. En particulier, la détection, l’évaluation pronostique et le traitement préventif des personnes qui sont à risque clinique élevé de développer une psychose (CHR-P)5 offre un potentiel unique pour modifier le cours du trouble, améliorant ainsi la qualité de vie de nombreuses personnes et de leurs familles3,6. Les personnes de CHR-P sont des jeunes à la recherche d’aide présentant des symptômes atténués et une déficience fonctionnelle7: leur risque de développer une psychose est de 20 % à 2 ans8, mais il est plus élevé dans certains sous-groupes spécifiques9,10. Malgré quelques progrès substantiels, l’impact des approches préventives dans la pratique clinique de routine est limité par la capacité de détecter la plupart des personnes qui sont à risque11. Les méthodes de détection actuelles sont basées sur des comportements et des références à la recherche d’aide sur des soupçons de risque de psychose; ces méthodes sont très inefficaces dans la manipulation d’un grand nombre d’échantillons11. Ainsi, l’évolutivité des méthodes de détection actuelles pour la grande majorité de la population à risque est assez limitée12. En fait, seulement 5 % (services spécialisés autonomes de détection précoce) à 12 % (services de santé mentale pour les jeunes) des personnes à risque de développer un premier trouble psychotique peuvent être détectés au moment de leur stade à risque par les stratégies de détection actuelles6.
Afin d’étendre les avantages cliniques des approches préventives chez un plus grand nombre de personnes à risque, nous avons mis au point une calculatrice de risque individualisée automatisée, inclusive sur la durée de vie (c.-à-d. à tous les âges), transdiagnostique (c.-à-d. à travers différents diagnostics)13, calculatrice de risque individualisée clinique, qui peut détecter les personnes à risque de psychose dans les soins de santé mentale secondaires à l’échelle, au-delà de celles qui répondent aux critères CHR-P14. Cette calculatrice de risque a utilisé un modèle de risque proportionnel Cox pour prédire le risque de développer un trouble psychotique sur six ans à partir de cinq variables cliniques régulièrement recueillies sélectionnées a priori, conformément aux lignes directrices méthodologiques15: âge, sexe, ethnie, âge par sexe et diagnostic principal de l’indice. Ces variables cliniques ont été sélectionnées sur la base d’une connaissance a priori obtenue à partir de méta-analyses16,17, comme le recommandent les lignes directrices méthodologiques de pointe15. Le nombre de prédicteurs est limité pour préserver le rapport Event Per Variable et minimiser les biais de suralimentation; y compris trop de variables sans filtre a priori conduit à des problèmes de surévabilité et une faible précision pronostique18. La méthode utilisée pour développer ce modèle fournit une précision pronostique similaire aux méthodes d’apprentissage automatique de la machine18. Les paramètres du modèle Cox ont été estimés sur la base d’une cohorte rétroécidentaire du South London et du Maudsley National Health Service Foundation Trust (SLaM)19. SLaM est une fiducie de santé mentale du National Health Service (NHS) qui fournit des soins de santé mentale secondaires à une population de 1,36 million de personnes dans le sud de Londres (Lambeth, Southwark, Lewisham et Croydon arrondissements), et a l’un des taux les plus élevés enregistrés de psychose dans le monde20. Toutes les données utilisées dans le développement du modèle ont été extraites de la plate-forme Clinical Record Interactive Search (CRIS), un système numérique de registre de cas, qui fournit aux chercheurs un accès et une analyse rétrospectifs des dossiers cliniques anonymes19. L’information clinique dans CRIS est extraite d’un système de dossier de santé électronique sur mesure (DSE), à SLaM, appelé système électronique de voyage des patients (ePJS). SLaM est sans papier et ePJS représente la plate-forme standard de collecte de données pour la routine clinique. Ainsi, la calculatrice de risque transdiagnostique tire parti des DSE et a le potentiel de dépister automatiquement les grands DSE des patients qui ont accès à des soins de santé mentale secondaires, afin de détecter ceux qui peuvent être à risque de psychose. L’algorithme de cette calculatrice de risque transdiagnostique a été publié précédemment6,14,21. La calculatrice de risque transdiagnostique a été validée à l’externe dans deux NHS Foundation Trusts14,21 etoptimisée 22, démontrant sa performance pronostique adéquate et sa généralisation entre différentes populations.
Selon les lignes directrices méthodologiques sur l’élaboration d’un modèle de prévision des risques15,23, la prochaine étape après le développement et la validation du modèle est de mettre en œuvre le modèle de prédiction dans la pratique clinique de routine. Les études de mise en œuvre sont généralement précédées d’études pilotes ou de faisabilité qui traitent des limitations pragmatiques potentielles associées à l’utilisation d’algorithmes de risque dans la pratique clinique. Par exemple, les données requises pour l’exécution d’une calculatrice, comme l’âge, le sexe et l’origine ethnique, peuvent ne pas être disponibles à la date du diagnostic ou mises à jour ultérieurement. Des méthodes efficaces pour traiter les données manquantes et synchroniser les mises à jour fréquentes dans les flux de données en temps réel devraient être envisagées pour obtenir les résultats de prédiction les plus fiables dans une implémentation. De plus, puisque le développement initial de la calculatrice de risque était fondé sur des données rétrospectives de cohorte, on ne sait pas s’il peut être utilisé dans un flux de données en temps réel qui est typique d’un environnement clinique réel. Un autre défi consiste à s’assurer que les cliniciens concernés reçoivent les recommandations générées par la calculatrice de risque dans un délai approprié et dans une voie de communication partagée et acceptée.
Pour surmonter ces limitations, nous avons terminé une étude de mise en œuvre de faisabilité utilisant la calculatrice de risque transdiagnostique individualisée. L’étude comprenait deux phases : une phase in vitro qui a été menée à l’aide des données du DSE local, sans communiquer avec des cliniciens ou des patients, et une phase in vivo, qui impliquait un contact direct avec les cliniciens. La phase in vitro avait deux objectifs multiples : (i) pour éliminer les obstacles à la mise en œuvre conformément au Cadre consolidé de recherche sur la mise en œuvre (CFIR)27 et (ii) pour intégrer la calculatrice de risque transdiagnostique dans le DSE local. Les obstacles à la mise en œuvre comprenaient la communication des résultats des risques aux cliniciens. Dans le SLaM, tous les patients sont invités à s’inscrire au consentement au contact (C4C), ce qui indique leur volonté d’être contacté pour la recherche, sans affecter la qualité des soins. Cela réduit les questions éthiques liées à la communication avec les patients. De plus, des groupes de travail avec des cliniciens ont aidé à adapter la façon dont cette information a été communiquée. Pendant la phase in vivo (14 mai 2018 au 29 avril 2019), toutes les personnes (i) âgées de plus de 14 ans (ii) qui accédaient à tout service SLaM (arrondissements de Lambeth, Southwark, Lewisham, Croydon), (iii) recevant un premier diagnostic primaire de l’indice ICD-10 de tout trouble mental non organique et non psychotique (à l’exception des troubles psychotiques aigus et transients; L’ATPD), ou une désignation CHR-P et (iv) avec les coordonnées existantes ont été jugés admissibles. Pendant la phase in vivo, de nouveaux patients accédant à SLaM chaque semaine ont été automatiquement examinés pour leur risque de psychose, et ceux avec un risque supérieur à un certain seuil ont été détectés. L’équipe de recherche a ensuite communiqué avec les cliniciens responsables des patients pour discuter d’autres recommandations et éventuellement suggérer une autre évaluation face à face6. Si les personnes évaluées étaient considérées comme répondant aux critères du CHR-P, elles étaient dirigées vers des services spécialisés CHR-P, tels que Outreach and Support in South London (OASIS)28. Ceci aurait comme conséquence la détection améliorée des individus avant l’apparition d’un désordre psychotique et fournirait une occasion significative pour modifier le cours du désordre. Essentiellement, cette étude de faisabilité a impliqué l’intégration complète de la calculatrice dans le système local de DSE, qui fait l’objet de l’article actuel. Le protocole complet de cette étude de faisabilité, y compris un aperçu du plan d’évaluation de la recherche proposée, des détails sur la gestion de la sécurité des données et des questions éthiques, a été présenté dans nos travaux précédents6. L’article actuel, dans le cadre de l’étude de faisabilité6, se concentre sélectivement sur la présentation de la mise en œuvre technique d’un système de détection et d’alerte en temps réel des risques de psychose basé sur les données locales du DSE. Plus précisément, l’objectif de cette étude est d’étudier la faisabilité technique de cette calculatrice de risque en temps opportun pour détecter les patients à risque dès qu’ils ont accès à un service secondaire de soins de santé mentale. Les résultats complets de l’étude de faisabilité, en ce qui concerne le respect par les cliniciens des recommandations formulées par la calculatrice de risque, seront présentés séparément. Une évaluation complète de l’efficacité de la recherche proposée, qui nécessite des conceptions randomisées, ne relève pas du programme de recherche actuel. À notre meilleure connaissance, il s’agit de la première méthode décrivant la mise en œuvre d’une calculatrice de risque basée sur des données live de DSE pour la détection précoce de la psychose.
Notre approche de la détection et de l’alerte des risques de psychose tire parti de la plate-forme CogStack. La plate-forme CogStack est une plate-forme de récupération d’informations légère, distribuée et tolérante aux défauts et à l’extraction de texte24. Cette plate-forme se compose de trois composants clés : 1) le pipeline CogStack qui utilise le cadre Java Spring Batch pour ingérer et synchroniser les données à partir d’une source de données prédéfinie (données DESE structurées et non structurées dans plusieurs formats tels que Word, fichiers PDF et images) à un puits de données prédéfinis en temps réel; 2) Elasticsearch, un moteur de recherche permettant le stockage et la requête du texte intégral des données de DSE, ainsi que la fourniture de diverses interfaces de programmation d’applications (API) pour intégrer des analyses avancées dans le moteur; et 3) Kibana, une interface utilisateur interactive basée sur le Web qui permet aux utilisateurs d’interroger des données dans Elasticsearch, de créer des tableaux de bord de visualisation et de mettre en alerte sur les anomalies ou autres modèles d’intérêt des données. De plus, CogStack intègre la capacité d’alerter les cliniciens sur les problèmes potentiels par courriel et SMS (texte), ce qui permet aux cliniciens de recevoir des notifications en temps opportun au sujet des patients à risque signalés par la calculatrice de risque.
Nous présentons un modèle de détection et d’alerte des risques de psychose basé sur ePJS chez SLaM, en tirant parti de la plate-forme CogStack. Comparée à la plate-forme CRIS qui fournit un mécanisme d’accès rétroactif aux dossiers de santé dé-identifiés à partir d’ePJS sur une base hebdomadaire19, la plate-forme CogStack chez SLaM permet l’accès à un DSE identifiable en temps réel, ce qui rapproche l’alerte du point de service et la prévision des risques dans une conception prospective, bien que les plates-formes CRIS et CogStack utilisent les données provenant de l’ePJS dans SLaM. Dans la section qui suit, nous fournissons des détails sur les étapes clés de notre approche, y compris la préparation des données sources du DSE, l’ingestion des données sources dans la plate-forme CogStack pour permettre une recherche en texte intégral via Elasticsearch, l’exécution de la calculatrice de risque de psychose à l’aide d’un fil De daemon Python, et la définition de visualisations interactives et d’alerte de risque en temps réel via l’interface Kibana. Tout chercheur qui vise à construire un système de détection et d’alerte des risques en temps réel basé sur les données du DSE peut suivre l’approche et sa mise en œuvre de référence. Comme nous l’allons le dire ci-dessous, la méthode proposée exploite des techniques open-source et légères avec une grande flexibilité et une portabilité. Cela permet d’exécuter la calculatrice de risque à divers endroits et montre une forte applicabilité à d’autres algorithmes d’estimation des risques. En outre, la méthode fonctionne comme une approche simple pour améliorer les fonctionnalités de détection des risques et d’alerte d’un DSE intégré dans un système de santé général.
Nous avons démontré la première mise en œuvre par DSE d’un système de détection et d’alerte des risques de psychose en temps réel basé sur CogStack, une plate-forme de récupération et d’extraction d’informations open source. En suivant cette approche, on peut transformer et ingérer un grand ensemble de données cliniques dans divers formats, y compris des informations structurées et non structurées, en une instance CogStack, afin de permettre la recherche en texte intégral, les analyses interactives et la visualisation des données, ainsi que l’alerte en temps réel aux cliniciens des patients qui sont à risque de psychose. Bien que la calculatrice de risque de psychose originale ait été validée dans des études pilotes dans plusieurs fiducies du NHS, bien qu’en utilisant des dossiers rétrospectifs pour les patients6,,14,21, cette conception expérimentale fournit la première base de preuves que cette calculatrice de risque peut être reproduite et déployée pour une utilisation en temps réel. Cette approche permet la livraison automatique de résultats pronostiques aux cliniciens par le biais de canaux de notification clinique existants, tels que l’email, en temps réel. Cela démontre clairement la faisabilité technique de la réalisation d’un essai d’efficacité à grande échelle pour évaluer l’utilité clinique ultime de cette calculatrice de risque dans le monde réel.
Ce protocole est empiriquement innovant, car il n’existe pas de système similaire de détection et d’alerte des risques pour la psychose. En outre, ce protocole a une grande généralisation dans l’utilisation clinique, en particulier en raison des forces uniques de notre approche. D’un point de vue théorique, nous avons utilisé un modèle de prévision des risques qui a été élaboré sur la base d’une importante cohorte rétroactive désidentitaire du SLaM NHS Trust. SLaM fournit des soins de santé mentale secondaires à une population de 1,36 million de personnes dans le sud de Londres et a l’un des taux les plus élevés enregistrés de psychose dans le monde. Cette grande cohorte, qui a une grande diversité dans les caractéristiques sociodémographiques et diagnostiques, nous permet de développer un modèle de prédiction des risques qui est peu susceptible d’être biaisé vers une population avec des caractéristiques spécifiques. Ceci est étayé par la preuve que l’exactitude pronostique de cette calculatrice de risque a déjà été reproduite deux fois dans deux bases de données différentes14,21, dont une en dehors de SLaM. Une autre force théorique de ce modèle de risque est que l’information de diagnostic démographique et clinique de base a été employée comme prédicteur. Ces informations sont omniprésentes dans les données cliniques électroniques et en fait les données manquantes pour ces prédicteurs se sont avérées relativement rares dans nos études précédentes14,21. La grande disponibilité de l’information pour les prédicteurs de construction permet de faire fonctionner la calculatrice de risque sur un grand nombre d’échantillons de patients dans différents secteurs secondaires de soins de santé mentale. En outre, la calculatrice de risque est un algorithme général qui convient à toutes les personnes à risque de développer une psychose dans les soins de santé mentale secondaires, quel que soit l’âge des individus. Autrement dit, cette calculatrice est non seulement adapté à la tranche d’âge 15-35 de pic de risque de psychose16, mais aussi pour ceux qui sont en dehors de cette gamme, montrant un degré élevé de généralisation.
D’un point de vue pratique, la calculatrice de risque et la plate-forme CogStack sont des services légers et open-source qui n’impliquent pas de techniques lourdes en ressources ou d’infrastructures coûteuses. Une telle plate-forme peu coûteuse et facile à déployer peut réduire les obstacles à son adoption dans des contextes cliniques réels. En outre, notre solution surmonte le principal obstacle à la mise en œuvre : les systèmes d’estimation des risques offrent peu de valeur à moins qu’ils ne soient utilisés par les cliniciens dans la pratique quotidienne25. Plus précisément, notre approche accède aux données du DSE, effectue des analyses indépendantes d’un système électronique de dossier médical et peut renvoyer les résultats d’analyse aux cliniciens par l’intermédiaire des canaux de notification existants. Cette méthode n’exige pas que la logique commerciale des systèmes préexistants soit modifiée et puisse fonctionner comme un service autonome pour soutenir et étendre les systèmes de soutien aux décisions cliniques existants. Ainsi, le protocole a une compatibilité élevée avec les systèmes cliniques préexistants et peut être facilement intégré dans la pratique clinique de routine. En outre, le protocole fournit des interfaces conviviales pour la recherche, l’analyse et la visualisation de données cliniques, ce qui permet aux cliniciens d’interpréter et d’explorer facilement les résultats du risque.
Ce protocole a également ses limites. Premièrement, l’efficacité de ce protocole n’a pas été évaluée dans la pratique clinique courante. Cette étude s’est concentrée sur les tests de faisabilité technique de la mise en œuvre d’un système de détection et d’alerte des risques de psychose en temps réel dans un DSE local. Pour évaluer davantage l’efficacité de ce système dans la pratique clinique de routine, de futurs essais contrôlés randomisés à grande échelle sont nécessaires6. Une deuxième limitation est que les prédictions des scores de risque dans ce protocole ont été faites sur la base des premiers diagnostics primaires, qui sont des données statiques recueillies à un seul instantané. Cependant, les symptômes du CHR-P évoluent intrinsèquement au fil du temps. Une version dynamique de calculatrice de risque de psychose, dans laquelle les modèles de prédiction peuvent être mis à jour dynamiquement pour refléter les changements, a été développé récemment26. Les travaux futurs seront axés sur l’intégration de cette calculatrice dynamique dans le protocole actuel.
L’étape la plus critique de cette approche a été l’identification des données de DSE qui ont été utilisées pour les prédicteurs d’extraits dans la calculatrice de risque. Il peut s’agir également de créer des cartographies des éléments de données, lorsqu’un système de DSE a utilisé un modèle de données différent de celui utilisé dans ce protocole, comme des systèmes de codage distincts pour les groupes ethniques des patients. Nous avons ouvert toutes les définitions de code et de cartographie en ligne(https://github.com/cogstack-slam/psychosis). Sur la base de ces matériaux, on serait en mesure de reproduire le déploiement ou d’ajuster la calculatrice en fonction de sa propre circonstance. Une autre étape critique a été la création d’une vue de base de données pour l’ingestion de données dans CogStack. Étant donné que les opérations de jointure relationnelle (c.-à-d. la combinaison de colonnes à partir d’une ou plusieurs tables de base de données) dans Elasticsearch peuvent entraîner des coûts de calcul élevés, nous avons effectué ces opérations de jointure dans la base de données du DSE en créant une vue de base de données. Ce point de vue combine toutes les informations nécessaires pour extraire les prédicteurs dans la calculatrice de risque, et deux champs vitaux qui ont été utilisés par les pipelines CogStack pour le partage des données dans l’ingestion de données. Le premier champ est une clé primaire unique pour chaque enregistrement dans la vue (“patient_id” utilisé ce protocole) et le second est un timestamp quand un enregistrement a été modifié plus récemment. Si ces deux champs n’étaient pas définis correctement, CogStack pourrait ne pas synchroniser les mises à jour des données dans une base de données de DSE en temps opportun. Des instructions détaillées pour les problèmes de dépannage sur l’ingestion de données CogStack sont disponibles sur https://cogstack.atlassian.net/wiki/spaces/COGDOC/overview et https://github.com/CogStack/CogStack-Pipeline.
Ce protocole est très transportable et peut être facilement déployé dans NHS Trusts qui ont une plate-forme CRIS ou CogStack. Jusqu’à présent, la plate-forme CRIS – y compris les procédures consentantes – a été entièrement décrite ailleurs et est en cours d’expansion à travers 12 NHS Trusts au Royaume-Uni, exploitant plus de 2 millions de dossiers de patients identifiés (https://crisnetwork.co/). De même, la plate-forme CogStack a été déployée non seulement dans SLaM, mais aussi d’autres NHS Trusts à travers le Royaume-Uni tels que University College London Hospitals (UCLH), King’s College Hospital (KCH), Guy’s et St Thomas’ (GSTT), et Mersey Care NHS Trusts. Ces fiducies sans plate-forme peuvent utiliser une version en ligne de calculatrice de risque (http://psychosis-risk.net), ou construire ce protocole à partir de zéro basé sur ce manuscrit et nos documents en ligne. Bien que ce protocole soit développé pour la détection des risques de psychose, la conception architecturale de ce protocole n’est pas liée à ce cas d’utilisation spécifique. Le protocole est suffisamment souple pour permettre la reconfiguration et la réutilisation des composantes de surveillance et d’alerte en temps réel pour d’autres domaines de mesure des risques, tels que les réactions indésirables aux médicaments, permettant ainsi aux cliniciens de prendre des mesures en temps opportun pour améliorer les soins, la sécurité et l’expérience des patients.
The authors have nothing to disclose.
Cette étude est financée par et est une production directe du King’s College London Confidence in Concept award du Conseil de recherches médicales (MRC) (MC_PC_16048) à PFP. RD et AR ont été soutenus par : a) la Maudsley Charity; b) le National Institute for Health Research (NIHR) Biomedical Research Centre at South London and Maudsley NHS Foundation Trust et King’s College London; c Health Data Research UK, qui est financé par le Conseil britannique de recherche médicale, Engineering and Physical Sciences Research Council, Economic and Social Research Council, Department of Health and Social Care (England), Chief Scientist Office of the Scottish Government Health and Social Care Directorates, Health and Social Care Research and Development Division (Welsh Government), Public Health Agency (Northern Ireland), British Heart Foundation et Wellcome Trust; d Le Consortium BigData@Heart, financé par l’Initiative pour les médicaments novateurs-2 Engagement conjoint en vertu de l’accord de subvention no 116074. Cette entreprise conjointe bénéficie du soutien du programme de recherche et d’innovation Horizon 2020 de l’Union européenne et de l’EFPIA; il est présidé, par DE Grobbee et SD Anker, en partenariat avec 20 partenaires universitaires et industriels et ESC; e) The National Institute for Health Research University College London Hospitals Biomedical Research Centre. Ces organismes de financement n’ont joué aucun rôle dans la conception de l’étude, de la collecte et des analyses. Les opinions exprimées sont celles de l’auteur et pas nécessairement celles du NHS, du NIHR ou du ministère de la Santé.
CogStack-Pipeline | King's College London | Open source software | |
Elasticsearch | Elastic NV | Open Source Search & Analytics | |
Kibana | Elastic NV | Open source data visualization plugin for Elasticsearch | |
Python packages ("elasticsearch", "elasticsearch_dsl", "pandas" and "numpy") | Open source community | Open source packages |