Demostramos cómo implementar un sistema de cálculo y alerta de riesgos de psicosis en tiempo real basado en CogStack, una plataforma de recuperación y extracción de información para registros médicos electrónicos.
Estudios recientes han demostrado que una calculadora de riesgo automatizada, con experiencia en vida útil, transdiagnóstico y basada clínicamente en la historia, proporciona un potente sistema para apoyar la detección temprana de individuos en riesgo de psicosis a gran escala, mediante el aprovechamiento de los registros electrónicos de salud (EPR). Esta calculadora de riesgos ha sido validada externamente dos veces y está en pruebas de viabilidad para la implementación clínica. La integración de esta calculadora de riesgos en la rutina clínica debe facilitarse mediante estudios prospectivos de viabilidad, que son necesarios para abordar los desafíos pragmáticos, como la falta de datos, y la usabilidad de esta calculadora de riesgos en un entorno clínico real y rutinario. Aquí, presentamos un enfoque para una implementación prospectiva de un servicio de detección y alerta de riesgos de psicosis en tiempo real en un sistema de EHR del mundo real. Este método aprovecha la plataforma CogStack, que es un sistema de extracción y extracción de información distribuida, ligero y de código abierto. La plataforma CogStack incorpora un conjunto de servicios que permiten la búsqueda de texto completo de datos clínicos, un cálculo en tiempo real con experiencia en la vida útil del riesgo de psicosis, alertas tempranas de riesgos para los médicos y el seguimiento visual de los pacientes a lo largo del tiempo. Nuestro método incluye: 1) la ingesta y sincronización de datos de múltiples fuentes en la plataforma CogStack, 2) la implementación de una calculadora de riesgos, cuyo algoritmo fue previamente desarrollado y validado, para el cálculo oportuno del riesgo de psicosis de un paciente, 3) la creación de visualizaciones interactivas y tableros para monitorear el estado de salud de los pacientes a lo largo del tiempo, y 4) la construcción de sistemas de alerta sin automatización para asegurar que los médicos sean notificados a los pacientes en riesgo , para que se puedan llevar a cabo las acciones apropiadas. Este es el primer estudio que ha desarrollado e implementado un sistema similar de detección y alerta en la rutina clínica para la detección temprana de psicosis.
Los trastornos psicóticos son enfermedades graves de salud mental que conducen a dificultades para distinguir entre la experiencia interna de la mente y la realidad externa del medio ambiente1,así como un riesgo superior a la media de autolesiones y suicidio2. Bajo la atención estándar, estos trastornos resultan en un impacto importante en la salud pública con una carga económica y de salud significativa para las personas, las familias y las sociedades en todo el mundo3. Las intervenciones tempranas en la psicosis pueden mejorar los resultados de este trastorno mental4. En particular, la detección, la evaluación del pronóstico y el tratamiento preventivo de las personas que están en alto riesgo clínico para desarrollar psicosis (CHR-P)5 proporciona un potencial único para alterar el curso del trastorno, mejorando así la calidad de vida de muchas personas y sus familias3,,6. Los individuos CHR-P son jóvenes que buscan ayuda que presentan síntomas atenuados y deterioro funcional7:su riesgo de desarrollar psicosis es del 20% a los 2 años8, pero es mayor en algunos subgrupos específicos9,,10. A pesar de algunos avances sustanciales, el impacto de los enfoques preventivos en la práctica clínica de rutina está limitado por la capacidad de detectar a la mayoría de las personas que están en riesgo11. Los métodos de detección actuales se basan en comportamientos de búsqueda de ayuda y referencias bajo sospecha de riesgo de psicosis; estos métodos son altamente ineficientes en el manejo de un gran número de muestras11. Por lo tanto, la escalabilidad de los métodos de detección actuales a la gran mayoría de la población en riesgo es bastante limitada12. De hecho, sólo el 5% (servicios independientes especializados de detección temprana) al 12% (servicios de salud mental juvenil) de las personas en riesgo de desarrollar un primer trastorno psicótico puede ser detectado en el momento de su etapa de riesgo por las estrategias de detección actuales6.
Para ampliar los beneficios clínicos de los enfoques preventivos en un mayor número de individuos en riesgo, desarrollamos una calculadora de riesgo automatizada, que incluye toda la vida (es decir, a través de todas las edades), transdiagnóstico (es decir, a través de diferentes diagnósticos)13, calculadora de riesgo individualizado basada en clínicas, que puede detectar individuos en riesgo de psicosis en la atención secundaria de salud mental a escala, más allá de aquellos que cumplen con los criterios14de CHR-P. Esta calculadora de riesgos utilizó un modelo de riesgo proporcional de Cox para predecir el riesgo de desarrollar un trastorno psicótico durante seis años a partir de cinco variables clínicas recogidas rutinariamente seleccionadas a priori, de acuerdo con las pautas metodológicas15:edad, género, etnia, edad por sexo y diagnóstico de índice primario. Estas variables clínicas se seleccionaron sobre la base de conocimientos a priori obtenidos a partir de metaanálisis16,,17, según lo recomendado por las directrices metodológicas de última generación15. El número de predictores se limita a conservar la relación Evento por variable y minimizar los sesgos de sobreajuste; incluyendo demasiadas variables sin filtro a priori conduce a problemas de sobreajuste y precisión de pronóstico deficiente18. El método utilizado para desarrollar este modelo proporciona una precisión de pronóstico similar a los métodos de aprendizaje automático18. Los parámetros del modelo Cox se estimaron sobre la base de una cohorte retrospectiva no identificada del South London y Maudsley National Health Service Foundation Trust (SLaM)19. SLaM es un fideicomiso de salud mental del Servicio Nacional de Salud (NHS) que proporciona atención secundaria de salud mental a una población de 1,36 millones de personas en el sur de Londres (distritos de Lambeth, Southwark, Lewisham y Croydon), y tiene una de las tasas más altas registradas de psicosis en el mundo20. Todos los datos utilizados en el desarrollo del modelo se extrajeron de la plataforma Clinical Record Interactive Search (CRIS), un sistema digital de registro de casos, que proporciona a los investigadores acceso retrospectivo y análisis de registros clínicos anónimos19. La información clínica en CRIS se extrae de un sistema de Registro Electrónico de Salud (EHR) a medida, en SLaM, llamado Sistema Electrónico de Viaje del Paciente (ePJS). SLaM está libre de papel y ePJS representa la plataforma de recopilación de datos estándar para la rutina clínica. Por lo tanto, la calculadora de riesgo transdiagnóstico aprovecha los EPR y tiene el potencial de examinar automáticamente los grandes EPR de los pacientes que acceden a la atención sanitaria mental secundaria, para detectar aquellos que pueden estar en riesgo de psicosis. El algoritmo de esta calculadora de riesgo transdiagnóstico se ha publicado previamente6,,14,21. La calculadora de riesgo transdiagnóstico ha sido validada externamente en dos NHS Foundation Trusts14,,21 y optimizado22,demostrando su adecuado rendimiento pronóstico y generalización en diferentes poblaciones.
De acuerdo con las directrices metodológicas sobre el desarrollo de un modelo de predicción de riesgos15,,23, el siguiente paso después del desarrollo y validación del modelo es implementar el modelo de predicción en la práctica clínica de rutina. Los estudios de implementación suelen ir precedidos de estudios piloto o de viabilidad que abordan posibles limitaciones pragmáticas asociadas con el uso de algoritmos de riesgo en la práctica clínica. Por ejemplo, es posible que los datos necesarios para ejecutar una calculadora, como la edad, el sexo y la etnia, no estén disponibles en la fecha del diagnóstico o se actualicen más adelante. Se deben considerar métodos eficaces para controlar los datos que faltan y sincronizar actualizaciones frecuentes en secuencias de datos en tiempo real para obtener los resultados de predicción más fiables en una implementación. Además, dado que el desarrollo inicial de la calculadora de riesgos se basó en datos retrospectivos de cohortes, no se sabe si se puede utilizar en un flujo de datos en tiempo real que es típico de un entorno clínico del mundo real. Otro desafío es asegurar que los médicos relevantes reciban las recomendaciones generadas por la calculadora de riesgos dentro de un plazo adecuado y dentro de una vía de comunicación compartida y aceptada.
Para superar estas limitaciones, hemos completado un estudio de implementación de viabilidad empleando la calculadora de riesgo transdiagnóstico individualizada. El estudio incluyó dos fases: una fase in vitro que se llevó a cabo utilizando datos de la EHR local, sin contactar a médicos o pacientes, y una fase in vivo, que implicó el contacto directo con los médicos. La fase in vitro tenía dos objetivos de gran fin: i) abordar las barreras de aplicación de acuerdo con el Marco Consolidado de Investigación en Implementación (CFIR)27 y ii) integrar la calculadora de riesgo transdiagnóstico en el EHR local. Las barreras de implementación incluyeron la comunicación de los resultados de riesgo a los médicos. En SLaM, se invita a todos los pacientes a registrarse en Consentimiento para el Contacto (C4C), lo que indica su disposición a ser contactados para la investigación, sin afectar la calidad de la atención. Esto reduce los problemas éticos relacionados con el contacto con los pacientes. Además, los grupos de trabajo con médicos ayudaron a adaptar la forma en que se comunicó esta información. Durante la fase in vivo (14 de mayo de 2018 a 29 de abril de 2019), todos los individuos (i) mayores de 14 años (ii) que accedían a cualquier servicio DeSM (municipios de Lambeth, Southwark, Lewisham, Croydon), (iii) recibiendo un primer diagnóstico primario del índice ICD-10 de cualquier trastorno mental no orgánico y no psicótico (con la excepción de Trastornos Psicóticos Agudos y Transitorios; ATPD), o una designación CHR-P y (iv) con los datos de contacto existentes se consideraron elegibles. Durante la fase in vivo, los nuevos pacientes que acceden a SLaM cada semana fueron automáticamente examinados para su riesgo de psicosis, y aquellos con un riesgo superior a un determinado umbral fueron detectados. A continuación, el equipo de investigación se comunicara con los médicos responsables de los pacientes para discutir otras recomendaciones y, finalmente, sugerir una nueva evaluación cara a cara6. Si se consideraba que los evaluados cumplían los criterios CHR-P, se remitían a los servicios especializados de CHR-P, como la divulgación y el apoyo en el sur de Londres (OASIS)28. Esto resultaría en una mejor detección de individuos antes de la aparición de un trastorno psicótico y proporcionar una oportunidad significativa para alterar el curso del trastorno. Fundamentalmente, este estudio de viabilidad implicó la integración completa de la calculadora en el sistema EHR local, que es el tema del artículo actual. El protocolo completo de este estudio de viabilidad, incluyendo una visión general del plan para la evaluación de la investigación propuesta, detalles sobre la gestión de la seguridad de los datos y cuestiones éticas, se ha presentado en nuestro trabajo anterior6. El artículo actual, como parte del estudio de viabilidad6,se centra selectivamente en presentar la implementación técnica de un sistema de detección y alerta de riesgos de psicosis en tiempo real basado en los datos locales de EHR. Más concretamente, el objetivo de este estudio es investigar la viabilidad técnica de esta calculadora de riesgos en la detección oportuna de pacientes en riesgo tan pronto como accedan a un servicio secundario de atención mental. Los resultados completos del estudio de viabilidad, en términos de adhesión de los médicos a las recomendaciones hechas por la calculadora de riesgos, se presentarán por separado. Una evaluación exhaustiva de la eficacia de la investigación propuesta, que requiere diseños aleatorios, está fuera del alcance del programa de investigación actual. Hasta nuestro mejor conocimiento, este es el primer método que describe la implementación de una calculadora de riesgos basada en datos EHR en vivo para la detección temprana de psicosis.
Nuestro enfoque para la detección de riesgos de psicosis y alertas aprovecha la plataforma CogStack. La plataforma CogStack es una plataforma de extracción de texto y recuperación de información ligera, distribuida y tolerante a errores24. Esta plataforma consta de tres componentes clave: 1) la canalización de CogStack que utiliza el marco Java Spring Batch para ingerir y sincronizar datos de un origen de datos predefinido (datos EHR estructurados y no estructurados en múltiples formatos como Word, archivos PDF e imágenes) a un receptor de datos predefinido en tiempo real; 2) Elasticsearch, un motor de búsqueda que permite el almacenamiento y la consulta del texto completo de los datos de EHR, así como proporcionar varias interfaces de programación de aplicaciones (API) para integrar análisis avanzados en el motor; y 3) Kibana, una interfaz de usuario interactiva basada en web que permite a los usuarios consultar datos en Elasticsearch, crear paneles de visualización y establecer alertas sobre anomalías u otros patrones de interés a partir de datos. Además, CogStack incorpora la capacidad de alertar a los médicos sobre posibles problemas por correo electrónico y SMS (texto), lo que permite a los médicos recibir notificaciones oportunas sobre pacientes en riesgo reportados por la calculadora de riesgos.
Presentamos un modelo de detección de riesgos de psicosis y alertas basadas en ePJS en SLaM, aprovechando la plataforma CogStack. En comparación con la plataforma CRIS que proporciona un mecanismo para el acceso retrospectivo a los registros de salud no identificados de ePJS semanalmente19,la plataforma CogStack de SLaM permite el acceso a un EHR identificable en tiempo real, acercando las alertas al punto de atención y a la predicción de riesgos en un diseño prospectivo, aunque tanto las plataformas CRIS como CogStack utilizan datos procedentes de ePJS en SLaM. En la sección siguiente, proporcionamos detalles de los pasos clave de nuestro enfoque, incluida la preparación de datos de origen desde el EHR, la ingesta de los datos de origen en la plataforma CogStack para habilitar la búsqueda de texto completo a través de Elasticsearch, la ejecución de la calculadora de riesgo de psicosis mediante un subproceso de demonio Python y la configuración de visualizaciones interactivas y alertas de riesgo en tiempo real a través de la interfaz de usuario de Kibana. Cualquier investigador que tenga como objetivo construir un sistema de detección y alerta de riesgos en tiempo real basado en datos de EHR puede seguir el enfoque y su implementación de referencia. Como explicaremos a continuación, el método propuesto explota técnicas de código abierto y ligeras con alta flexibilidad y portabilidad. Esto permite que la calculadora de riesgos se ejecute en varias ubicaciones y muestra una alta aplicabilidad a otros algoritmos de estimación de riesgos. Además, el método funciona como un enfoque sencillo para mejorar las funcionalidades de detección y alerta de riesgos de un EHR integrado en un sistema general de salud.
Hemos demostrado la primera implementación de EHR de un sistema de detección y alerta de riesgos de psicosis en tiempo real basado en CogStack, una plataforma de extracción y recuperación de información de código abierto. Siguiendo este enfoque, se puede transformar e ingerir un gran conjunto de datos clínicos en varios formatos, incluida la información estructurada y no estructurada, en una instancia de CogStack, con el fin de permitir la búsqueda de texto completo, análisis interactivos y visualización de datos, así como alertas en tiempo real a los médicos de pacientes que están en riesgo de psicosis. Aunque la calculadora de riesgo de psicosis original ha sido validada en estudios piloto a través de varios nhS Trusts, aunque utilizando registros retrospectivos de pacientes6,,14,21, este diseño experimental proporciona la primera base de evidencia de que esta calculadora de riesgo puede ser replicada e implementada para su uso en tiempo real. Este enfoque permite la entrega automática de resultados de pronóstico a los médicos a través de los canales de notificación clínica existentes, como el correo electrónico, en tiempo real. Esto demuestra claramente la viabilidad técnica para llevar a cabo un ensayo de eficacia a gran escala para evaluar la utilidad clínica definitiva de esta calculadora de riesgo en el mundo real.
Este protocolo es empíricamente innovador, ya que no existe un sistema similar de detección y alerta de riesgos para la psicosis. Además, este protocolo tiene una alta generalización en el uso clínico, especialmente debido a las fortalezas únicas de nuestro enfoque. Desde una perspectiva teórica, utilizamos un modelo de predicción de riesgos que se desarrolló sobre la base de una gran cohorte retrospectiva no identificada del SLaM NHS Trust. SLaM proporciona atención secundaria de salud mental a una población de 1,36 millones de personas en el sur de Londres y tiene una de las tasas más altas registradas de psicosis en el mundo. Esta gran cohorte, que tiene una gran diversidad en características sociodemográficas y diagnósticas, nos permite desarrollar un modelo de predicción de riesgos que es poco probable que se sesquee hacia una población con características específicas. Esto está respaldado por la evidencia de que la precisión del pronóstico de esta calculadora de riesgo ya se ha replicado dos veces en dos bases de datos diferentes14,21, incluyendo una fuera de SLaM. Otra fortaleza teórica de este modelo de riesgo es que la información básica de diagnóstico demográfico y clínico se utilizó como predictores. Esta información es omnipresente en los datos clínicos electrónicos y, de hecho, se ha demostrado que los datos faltantes para estos predictores son relativamente raros en nuestros estudios anteriores14,21. La alta disponibilidad de información para la creación de predictores permite ejecutar la calculadora de riesgos en un gran número de muestras de pacientes en diferentes sectores secundarios de atención de salud mental. Además, la calculadora de riesgos es un algoritmo general que es adecuado para todas las personas en riesgo de desarrollar psicosis en la atención de salud mental secundaria, independientemente de las edades de las personas. Es decir, esta calculadora no sólo es adecuada para el rango de edad 15-35 de riesgo de psicosis pico16,sino también para aquellos fuera de este rango, mostrando un alto grado de generalización.
Desde una perspectiva práctica, tanto la calculadora de riesgos como la plataforma CogStack son servicios ligeros y de código abierto que no implican técnicas con muchos recursos o costosas infraestructuras. Una plataforma tan fácil de usar y fácil de implementar puede reducir las barreras a su adopción en entornos clínicos del mundo real. Además, nuestra solución supera la principal barrera de implementación: los sistemas de estimación de riesgos proporcionan poco valor a menos que sean utilizados por los médicos en la práctica diaria25. Específicamente, nuestro enfoque accede a los datos de la EHR, realiza análisis independientemente de un sistema de registro médico electrónico y puede enviar los resultados del análisis a los médicos a través de los canales de notificación existentes. Este método no requiere que se modifique la lógica empresarial de los sistemas preexistentes y que pueda funcionar como un servicio independiente para apoyar y ampliar los sistemas de apoyo a la toma de decisiones clínicas existentes. Por lo tanto, el protocolo tiene una alta compatibilidad con los sistemas clínicos preexistentes y se puede integrar fácilmente en la práctica clínica de rutina. Además, el protocolo proporciona interfaces fáciles de usar para la búsqueda, análisis y visualización de datos clínicos, lo que facilita a los médicos la interpretación y exploración de los resultados de riesgo.
Este protocolo también tiene sus limitaciones. En primer lugar, la eficacia de este protocolo no se ha evaluado en la práctica clínica de rutina. Este estudio se centró en pruebas de viabilidad técnica de la implementación de un sistema de detección y alerta de psicosis en tiempo real en un EHR local. Para evaluar aún más la eficacia de este sistema en la práctica clínica de rutina, se necesitan futuros ensayos controlados aleatorizados a gran escala6. Una segunda limitación es que las predicciones de las puntuaciones de riesgo en este protocolo se realizaron en función de los primeros diagnósticos primarios, que son datos estáticos recopilados en una sola instantánea. Sin embargo, los síntomas de CHR-P están evolucionando intrínsecamente con el tiempo. Recientemente se ha desarrollado una versión dinámica de la calculadora de riesgo de psicosis, en la que los modelos de predicción se pueden actualizar dinámicamente para reflejar loscambios. El trabajo futuro se centrará en la integración de esta calculadora dinámica en el protocolo actual.
El paso más importante en este enfoque fue identificar los datos de EHR que se utilizaron para los predictores de extractos en la calculadora de riesgos. Esto también puede implicar la creación de asignaciones de elementos de datos, cuando un sistema EHR utiliza un modelo de datos diferente del utilizado en este protocolo, como sistemas de codificación distintos para los grupos étnicos de los pacientes. Hemos abierto todo el código y las definiciones de asignación en línea (https://github.com/cogstack-slam/psychosis). Sobre la base de estos materiales, uno sería capaz de replicar la implementación o ajustar la calculadora dependiendo de la propia circunstancia. Otro paso crítico fue la creación de una vista de base de datos para la ingesta de datos en CogStack. Dado que las operaciones de combinación relacional (es decir, la combinación de columnas de una o varias tablas de base de datos) en Elasticsearch pueden conllevar un alto costo computacional, llevamos a cabo estas operaciones de combinación en la base de datos EHR mediante la creación de una vista de base de datos. Esta vista combinaba toda la información necesaria para extraer predictores en la calculadora de riesgos y dos campos vitales utilizados por las canalizaciones de CogStack para la partición de datos en la ingesta de datos. El primer campo es una clave principal única para cada registro de la vista(“patient_id” utilizó este protocolo) y el segundo es una marca de tiempo cuando un registro se modificó más recientemente. Si estos dos campos no se establecieron correctamente, es posible que CogStack no sincronice las actualizaciones de datos en una base de datos EHR a tiempo. Las instrucciones detalladas para solucionar problemas en la ingesta de datos de CogStack están disponibles en https://cogstack.atlassian.net/wiki/spaces/COGDOC/overview y https://github.com/CogStack/CogStack-Pipeline.
Este protocolo es altamente transportable y se puede implementar fácilmente en nhS Trusts que tienen una plataforma CRIS o CogStack. Hasta ahora, la plataforma CRIS, incluidos los procedimientos de consentimiento, se ha descrito completamente en otros lugares y está en expansión en 12 NHS Trusts en el Reino Unido, aprovechando más de 2 millones de registros de pacientes desidentificados(https://crisnetwork.co/). Del mismo modo, la plataforma CogStack se ha implementado no sólo en SLaM, sino también en otros nhS Trusts en todo el Reino Unido, como University College London Hospitals (UCLH), King’s College Hospital (KCH), Guy’s and St Thomas’ (GSTT) y Mersey Care NHS Trusts. Aquellos Fideicomisos sin plataforma pueden utilizar una versión en línea de la calculadora de riesgo(http://psychosis-risk.net), o construir este protocolo desde cero basado en este manuscrito y nuestros documentos en línea. Aunque este protocolo está desarrollado para la detección de riesgos de psicosis, el diseño arquitectónico de este protocolo no está vinculado a este caso de uso específico. El protocolo es lo suficientemente flexible como para permitir la reconfiguración y reasignación de los componentes de monitoreo y alerta en tiempo real para otras áreas de medición de riesgos, como reacciones adversas a medicamentos, permitiendo así a los médicos tomar medidas oportunas para mejorar la atención, la seguridad y la experiencia del paciente.
The authors have nothing to disclose.
Este estudio está financiado por el King’s College London Confidence in Concept y es un resultado directo del Premio King’s College London Confidence in Concept del Consejo de Investigación Médica (MC_PC_16048) a PFP. RD y AR fueron apoyados por: (a) la Caridad Maudsley; (b) el Centro de Investigación Biomédica del Instituto Nacional de Investigaciones Sanitarias (NIHR) en el sur de Londres y Maudsley NHS Foundation Trust y King’s College London; c Health Data Research UK, financiado por el Consejo de Investigación Médica del Reino Unido, Consejo de Investigación de Ingeniería y Ciencias Físicas del Reino Unido, Consejo de Investigación Económica y Social, Departamento de Salud y Atención Social (Inglaterra), Oficina de Científicos Jefes de las Direcciones de Salud y Atención Social del Gobierno Escocés, División de Investigación y Desarrollo de Salud y Cuidado Social (Gobierno de Gales), Agencia de Salud Pública (Irlanda del Norte), British Heart Foundation y Wellcome Trust; (d) El Consorcio BigData@Heart, financiado por la Iniciativa de Medicamentos Innovadores-2 Empresa Común en virtud del acuerdo de subvención No 116074. Esta Empresa Común recibe el apoyo del programa de investigación e innovación Horizonte 2020 de la Unión Europea y de la EFPIA; está presidida por DE Grobbee y SD Anker, asociándose con 20 socios académicos y de la industria y ESC; y e) El Instituto Nacional de Investigación Sanitaria University College London Hospitals Biomedical Research Centre. Estos organismos de financiación no desempeñaron ningún papel en el diseño del estudio, la recopilación y los análisis. Las opiniones expresadas son las del autor o autores y no necesariamente las del NHS, el NIHR o el Departamento de Salud.
CogStack-Pipeline | King's College London | Open source software | |
Elasticsearch | Elastic NV | Open Source Search & Analytics | |
Kibana | Elastic NV | Open source data visualization plugin for Elasticsearch | |
Python packages ("elasticsearch", "elasticsearch_dsl", "pandas" and "numpy") | Open source community | Open source packages |