Мы демонстрируем, как развернуть в режиме реального времени систему расчета риска психоза и оповещения на основе CogStack, платформы поиска информации и извлечения для электронных медицинских записей.
Недавние исследования показали, что автоматизированный, охватывающий жизнь, трансдиагностику и клинически основанный индивидуальный калькулятор риска обеспечивает мощную систему поддержки раннего выявления лиц, подверженных риску психоза в больших масштабах, путем использования электронных медицинских карт (EHRs). Этот калькулятор риска был дважды проверен на внешней его проверке и проходит технико-экономическое обоснование для клинической реализации. Интеграция этого калькулятора риска в клиническую рутину должна быть обеспечена перспективными технико-экономическими исследованиями, которые необходимы для решения прагматических задач, таких как отсутствие данных, и удобство использования этого калькулятора риска в реальных и рутинных клинических условиях. Здесь мы представляем подход к предполагаемой реализации службы обнаружения и оповещения о рисках психоза в реальном времени в реальной системе EHR. Этот метод использует платформу CogStack, которая является системой поиска информации с открытым исходным кодом, легкой и распределенной информацией. Платформа CogStack включает в себя набор услуг, которые позволяют полнотекстовый поиск клинических данных, продолжительность жизни включительно, в режиме реального времени расчет риска психоза, раннего риска оповещения врачей, и визуальный мониторинг пациентов с течением времени. Наш метод включает в себя: 1) прием и синхронизацию данных из нескольких источников в платформу CogStack, 2) внедрение калькулятора рисков, алгоритм которого был ранее разработан и проверен, для своевременного расчета риска психоза пациента, 3) создание интерактивных визуализаций и приборных панелей для мониторинга состояния здоровья пациентов с течением времени, и 4) создание автоматизированных систем оповещения для обеспечения того, чтобы врачи не были уверены в пациентах, , так что соответствующие действия могут быть продолжены. Это первое в истории исследование, которое разработало и внедрило аналогичную систему обнаружения и оповещения в клинической рутине для раннего выявления психоза.
Психотические расстройства являются серьезными психическими расстройствами, которые приводят к трудностям в различении внутреннего опыта ума и внешней реальности окружающей среды1,а также выше, чем средний риск причинения себе вреда и самоубийства2. При стандартном уходе эти расстройства приводят к серьезным последствиям для здоровья населения со значительным бременем для здоровья и экономического бремени для отдельных лиц, семей и обществ во всем мире3. Ранние вмешательства в психоз может улучшить результаты этого психического расстройства4. В частности, выявление, прогностического оценки и профилактического лечения лиц, которые находятся в клиническом высоком риске развития психоза (CHR-P)5 предоставляет уникальный потенциал для изменения хода расстройства, тем самым улучшая качество жизни для многих людей и их семей3,6. CHR-P лиц помощи ищет молодых людей, представляющих с ослабленными симптомами и функциональных нарушений7: их риск развития психоза составляет 20% на 2-летний8, но это выше в некоторых конкретных подгрупп9,10. Несмотря на некоторые существенные достижения, влияние профилактических подходов в обычной клинической практике ограничено способностью обнаруживать большинство людей, которые находятся в группе риска11. Современные методы обнаружения основаны на поведении и направлениях по подозрению в риске психоза; эти методы крайне неэффективны при обработке большого количества образцов11. Таким образом, масштабируемость современных методов обнаружения для подавляющего большинства населения, подверженного риску, довольноограничена 12. В самом деле, только 5% (автономные специализированные услуги раннего обнаружения) до 12% (молодежные службы психического здоровья) лиц, подверженных риску развития первого психотического расстройства могут быть обнаружены во время их стадии риска в настоящее время стратегии обнаружения6.
Для расширения клинических преимуществ профилактических подходов в большем числе лиц из группы риска, мы разработали автоматизированный, продолжительность жизни включительно (т.е. во всех возрастных группах), трансдиагностика (т.е. по различным диагнозам)13, клинически-индивидуальный калькулятор риска, который может обнаружить лиц, подверженных риску психоза в вторичной психиатрической помощи в масштабе, за пределами тех, кто отвечает критериям CHR-P14. Этот калькулятор риска использовал модель пропорциональной опасности Кокса для прогнозирования риска развития психотического расстройства в течение шести лет из пяти регулярно собранных клинических переменных, выбранных априори, в соответствии с методологическими рекомендациями15:возраст, пол, этническая принадлежность, возраст за полом и первичный индекс диагностики. Эти клинические переменные были выбраны на основе априорных знаний, полученных из мета-анализа16,17, в соответствии с самыми современными методологическими руководящими принципами15. Количество предикторов ограничено для сохранения коэффициента Event Per Variable и минимизации переукладочных смещений; в том числе слишком много переменных без априорного фильтра приводит к переукладыванию проблем и плохой прогноститической точности18. Метод, используемый для разработки этой модели обеспечивает аналогичную прогностиковую точность для автоматических методов машинного обучения18. Параметры модели Кокса были оценены на основе ретроспективной де-идентифицированной когорты из южного Лондона и Модсли Национального фонда службы здравоохранения Фонда Trust (SLaM)19. SLaM является Национальной службы здравоохранения (NHS) психического здоровья доверия, который обеспечивает вторичное психическое здоровье населения 1,36 миллиона человек в южном Лондоне (Ламбет, Саутварк, Льюисем и Кройдон районов), и имеет один из самых высоких зарегистрированных показателей психоза в мире20. Все данные, использованные в разработке модели, были извлечены из платформы Clinical Record Interactive Search (CRIS), цифровой системы регистра случаев, которая предоставляет исследователям ретроспективный доступ и анализ анонимизированных клинических записей19. Клиническая информация в CRIS извлекается из на заказ электронной системы медицинской записи (EHR) в SLaM, называемой электронной системой путешествий пациентов (ePJS). SLaM не имеет документов, а ePJS представляет собой стандартную платформу сбора данных для клинической рутины. Таким образом, трансдиагностический калькулятор риска использует EHRs и имеет потенциал для автоматического проверки больших EHRs пациентов, имеющих доступ к вторичной психической помощи, чтобы обнаружить тех, кто может быть подвержен риску психоза. Алгоритм этого трансдиагностического калькулятора6риска был опубликован ранее6,14,,21. Трансдиагностический калькулятор риска был внешне проверен в двух NHS Foundation Trusts14,,21 и оптимизирован22,демонстрируя его адекватную прогностичную производительность и обобщаемость среди различных групп населения.
В соответствии с методологическими рекомендациями по разработке модели прогнозирования риска15,,23, следующим шагом после разработки модели и проверки является внедрение модели прогнозирования в обычной клинической практике. Исследованиям по имплементности обычно предшествуют экспериментальные или технико-экономические обоснования, в которых рассматриваются потенциальные прагматические ограничения, связанные с использованием алгоритмов риска в клинической практике. Например, необходимые данные для работы калькулятора, такие как возраст, пол и этническая принадлежность, могут быть недоступны на дату постановки диагноза или обновлены позже. Следует учитывать эффективные методы обработки недостающих данных и синхронизации частых обновлений в потоках данных в режиме реального времени для получения наиболее надежных результатов прогнозирования в реализации. Кроме того, поскольку первоначальная разработка калькулятора рисков была основана на ретроспективных данных когорты, неизвестно, можно ли его использовать в реальном времени, что характерно для реальных клинических условий. Еще одна проблема заключается в обеспечении того, чтобы соответствующие врачи получали рекомендации, порожденные калькулятором риска, в соответствующие сроки и в рамках общего и общепринятого пути коммуникации.
Чтобы преодолеть эти ограничения, мы завершили исследование технико-экономического обоснования с использованием индивидуального трансдиагностического калькулятора риска. Исследование включало в себя два этапа: фазу in vitro, которая проводилась с использованием данных местного EHR, без контакта с врачами или пациентами, и фазу in vivo, которая включала прямой контакт с врачами. Этап in vitro имел две цели: i) для устранения барьеров на пути осуществления в соответствии с Сводными рамочными рамками для проведения исследований в области осуществления (CFIR)27 и (ii) для интеграции калькулятора трансдиагностических рисков в местный ЕПЧ. Барьеры, препятствующие осуществлению, включали сообщение о результатах риска врачам. В SLaM, все пациенты приглашаются зарегистрироваться для согласия на контакт (C4C), что указывает на их готовность связаться для исследования, не влияя на качество медицинской помощи. Это уменьшает этические вопросы, связанные с контактом с пациентами. В дополнение к этому, рабочие группы с врачами помогли пошив того, как эта информация была передана. Во время фазы in vivo (14 мая 2018 года по 29 апреля 2019 года) все лица (i) старше 14 лет (ii), которые получали доступ к любой службе SLaM (районы Ламбет, Саутварк, Льюисхэм, Кройдон), (iii) получение первого индекса МКБ-10 первичной диагностики любых непсихотических расстройств ATPD), или chR-P обозначение и (iv) с существующими контактными данными были признаны подходящими. Во время фазы in vivo, новые пациенты, доступ к SLaM каждую неделю были автоматически проверены на риск психоза, и те, с риском больше, чем определенный порог были обнаружены. Исследовательская группа затем связался с пациентами ответственных врачей, чтобы обсудить дальнейшие рекомендации и в конечном итоге предложить дальнейшее лицом к лицу оценки6. Если считается, что эти оценки отвечают критериям КПЧ-П, они направляются в специализированные службы CHR-P, такие как информационно-пропагандистская и поддержка в южном Лондоне (OASIS)28. Это приведет к улучшению обнаружения лиц до начала психотического расстройства и обеспечить значительную возможность для изменения хода расстройства. Важно отметить, что это технико-экономическое обоснование включало полную интеграцию калькулятора в местную систему EHR, которая является темой текущей статьи. Полный протокол этого технико-экономического обоснования, включая обзор плана оценки предлагаемых исследований, подробную информацию об управлении безопасностью данных и этические вопросы, был представлен в нашей предыдущей работе6. Текущая статья, как часть технико-экономического обоснования6,выборочно фокусируется на представлении технической реализации системы обнаружения и оповещения о рисках психоза в реальном времени на основе местных данных EHR. В частности, цель этого исследования заключается в изучении технической осуществимости этого калькулятора риска в своевременном выявлении пациентов из группы риска, как только они получают доступ к вторичной психиатрической помощи. Полные результаты технико-экономического обоснования с точки зрения соблюдения врачами рекомендаций, сделанных калькулятором риска, будут представлены отдельно. Всеобъемлющая оценка эффективности предлагаемых исследований, которая требует рандомизированных конструкций, выходит за рамки текущей исследовательской программы. Насколько нам известно, это первый метод, описывающий внедрение калькулятора риска на основе живых данных EHR для раннего выявления психоза.
Наш подход к выявлению и предупреждению о рисках психоза использует преимущества платформы CogStack. Платформа CogStack представляет собой легкую, распределенную и терпимую к ошибкам платформу поиска информации и извлечения текста24. Эта платформа состоит из трех ключевых компонентов: 1) конвейер CogStack, который использует платформу Java Spring Batch для глотания и синхронизации данных из заранее определенного источника данных (как структурированных, так и неструктурированных EHR-данных в нескольких форматах, таких как Word, PDF-файлы и изображения) для заранее определенного поглотителя данных в режиме реального времени; 2) Elasticsearch, поисковая система, позволяющая хранить и запросить полный текст данных EHR, а также предоставлять различные интерфейсы программирования приложений (AA) для встраивания расширенной аналитики в движок; и 3) Kibana, интерактивный веб-интерфейс пользователя, который позволяет пользователям задавивать данные в Elasticsearch, создавать панели визуализации и устанавливать оповещения об аномалиях или других закономерностях, представляющих интерес для данных. Кроме того, CogStack включает в себя возможность оповещения врачей о потенциальных проблемах по электронной почте и SMS (текст), что позволяет врачам получать своевременное уведомление о пациентах из группы риска, о которых сообщает калькулятор риска.
Мы представляем модель обнаружения риска психоза и оповещения на основе ePJS в SLaM, используя платформу CogStack. По сравнению с платформой CRIS, которая обеспечивает механизм ретроспективного доступа к деидентифицированным медицинским записям от ePJS на еженедельной основе19, платформа CogStack в SLaM позволяет получить доступ к идентифицируемому EHR в режиме реального времени, приближая оповещение к точке обслуживания и прогнозированию рисков в перспективном дизайне, хотя платформы CRIS и CogStack используют данные, полученные от ePJS. В следующем разделе мы предоставляем подробную информацию о ключевых шагах нашего подхода, включая подготовку исходных данных из EHR, попастание исходных данных в платформу CogStack для включения полнотекстовых поисков через Elasticsearch, запуск калькулятора риска психоза с помощью потока Python daemon и оповещения о рисках в реальном времени с помощью пользовательского интерфейса Kibana. Любой исследователь, который стремится создать систему обнаружения и оповещения о рисках в режиме реального времени на основе данных EHR, может следовать этому подходу и его эталонной реализации. Как мы уточним ниже, предлагаемый метод использует с открытым исходным кодом, легкие методы с высокой гибкостью и портативностью. Это позволяет работать в различных местах калькулятору риска и показывает высокую применимость к другим алгоритмам оценки рисков. Кроме того, метод работает как простой подход для повышения обнаружения рисков и оповещения функциональных возможностей EHR, встроенных в общую систему здравоохранения.
Мы продемонстрировали первую реализацию EHR в режиме реального времени психоз системы обнаружения и оповещения на основе CogStack, с открытым исходным кодом информации поиска и извлечения платформы. Следуя этому подходу, можно трансформировать и глотать большой набор клинических данных в различных форматах, включая структурированную и неструктурированную информацию, в экземпляр CogStack, с тем чтобы обеспечить полный текстовый поиск, интерактивный анализ и визуализацию данных, а также оповещения в режиме реального времени врачам пациентов, которые подвержены риску психоза. Хотя оригинальный калькулятор риска психоза был проверен в экспериментальных исследованиях через несколько NHS Trusts, хотя и с использованием ретроспективных записей пациента6,14,21, этот экспериментальный дизайн обеспечивает первую доказательную базу, что этот калькулятор риска может быть воспроизведен и развернут для использования в режиме реального времени. Такой подход позволяет автоматически доставлять прогностического результаты клиницистам через существующие клинические каналы уведомления, такие как Электронная почта, в режиме реального времени. Это наглядно демонстрирует техническую целесообразность проведения крупномасштабного испытания эффективности для оценки конечной клинической полезности этого калькулятора риска в реальном мире.
Этот протокол является эмпирически инновационным, так как не существует аналогичной системы обнаружения риска и оповещения о психозах. Кроме того, этот протокол имеет высокую обобщаемость в клиническом использовании, особенно из-за уникальных сильных сторон нашего подхода. С теоретической точки зрения мы использовали модель прогнозирования рисков, которая была разработана на основе большой ретроспективной де-идентифицированной когорты от SLaM NHS Trust. SLaM обеспечивает вторичное психиатрическое обслуживание для населения 1,36 миллиона человек в южной части Лондона и имеет один из самых высоких зарегистрированных показателей психоза в мире. Эта большая когорта, которая имеет большое разнообразие в социодемографических и диагностических характеристиках, позволяет нам разработать модель прогнозирования риска, которая вряд ли будет смещена по отношению к населению с конкретными характеристиками. Это подтверждается доказательствами того, что прогностичная точность этого калькулятора риска уже была воспроизведена дважды в двух различных базах данных14,,21, в том числе один за пределами SLaM. Еще одна теоретическая сила этой модели риска заключается в том, что в качестве предикторов использовалась базовая информация о демографической и клинической диагностике. Такая информация является повсеместной в электронных клинических данных и на самом деле недостающие данные для этих предикторов было показано, что относительно редко в наших предыдущих исследованиях14,21. Высокая доступность информации для строительных предикторов позволяет запустить калькулятор риска в течение большого числа образцов пациентов в различных секторах среднего психического здоровья. Кроме того, калькулятор риска является общим алгоритмом, который подходит для всех лиц, подверженных риску развития психоза в средней психиатрической помощи, независимо от возраста людей. То есть, этот калькулятор подходит не только для 15-35 возрастного диапазона пикового риска психоза16, но и для тех, кто за пределами этого диапазона, показывая высокую степень обобщенности.
С практической точки зрения, как калькулятор рисков, так и платформа CogStack являются легкими и открытыми исходными кодами, которые не связаны с ресурсами тяжелых методов или дорогостоящей инфраструктуры. Такая недорогая и простая в развертывании платформа может снизить барьеры на пути ее внедрения в реальных клинических условиях. Кроме того, наше решение преодолевает основной барьер реализации: системы оценки риска не дают большого значения, если они не используются врачами в повседневной практике25. В частности, наш подход получает доступ к данным Из ЕСПЧ, проводит анализы независимо от электронной системы медицинской документации и может отправлять результаты анализа врачам через существующие каналы уведомлений. Этот метод не требует, чтобы бизнес-логика в уже существующих системах была изменена и может работать как самостоятельная служба поддержки и расширения существующих систем поддержки клинических решений. Таким образом, протокол имеет высокую совместимость с уже существующими клиническими системами и может быть легко интегрирован в обычную клиническую практику. Кроме того, протокол предоставляет удобные интерфейсы для поиска, анализа и визуализации клинических данных, которые облегчают для врачей интерпретировать и изучать результаты риска.
Этот протокол также имеет свои ограничения. Во-первых, эффективность этого протокола не была оценена в обычной клинической практике. В этом исследовании основное внимание уделялось техническим технико-экономическим испытаниям внедрения системы обнаружения и оповещения о рисках психоза в режиме реального времени в местном EHR. Для дальнейшей оценки эффективности этой системы в обычной клинической практике, в будущем крупномасштабные рандомизированные контролируемые испытания необходимы6. Второе ограничение состоит в том, что прогнозы оценки риска в этом протоколе были сделаны на основе первых первичных диагнозов, которые представляют собой статические данные, собранные на одном снимке. Тем не менее, симптомы CHR-P внутренне развиваются с течением времени. Динамическая версия калькулятора риска психоза, в котором модели прогнозирования могут быть динамически обновлены, чтобы отразить изменения, была разработана недавно26. Будущая работа будет сосредоточена на интеграции этого динамического калькулятора в текущий протокол.
Наиболее важным шагом в этом подходе была идентификация данных EHR, которые использовались для прогнозирования экстрактов в калькуляторе рисков. Это может также включать создание карт элементов данных, когда система EHR использовала модель данных, отличную от той, которая используется в этом протоколе, например, различные системы кодирования для этнических групп пациентов. Мы с открытым исходным кодом все код и отображение определений в Интернете(https://github.com/cogstack-slam/psychosis). На основе этих материалов можно было бы воспроизвести развертывание или настроить калькулятор в зависимости от собственных обстоятельств. Другим важным шагом стало создание представления базы данных для приема данных в CogStack. Поскольку операции реляционного соединения (т.е. объединение столбцов из одной или нескольких таблиц баз данных) в Elasticsearch могут привести к высокой вычислительной стоимости, мы провели эти операции соединения в базе данных EHR, создав представление базы данных. Это представление объединило всю информацию, необходимую для извлечения предикторов в калькуляторе рисков, и два жизненно важных поля, которые использовались конвейерами CogStack для раздела данных при проглатке данных. Первое поле является уникальным основным ключом для каждой записи в представлении(“patient_id”использовал этот протокол), а второе — это метка времени, когда запись была изменена совсем недавно. Если эти два поля не были установлены должным образом, CogStack может не синхронизировать обновления данных в базе данных EHR своевременно. Подробные инструкции по устранению неполадок при водоеме CogStack доступны https://cogstack.atlassian.net/wiki/spaces/COGDOC/overview и https://github.com/CogStack/CogStack-Pipeline.
Этот протокол очень транспортируемый и может быть легко развернут в NHS Trusts, которые имеют платформу CRIS или CogStack. До сих пор платформа CRIS, включая процедуры согласия, была полностью описана в другом месте и находится в стадии расширения через 12 NHS Trusts в Великобритании, используя более 2 миллионов деидентифицированных записей пациентов(https://crisnetwork.co/). Аналогичным образом, платформа CogStack была развернута не только в SLaM, но и других трастов ГСЗ по всей Великобритании, таких как Университетский колледж Лондона больницы (UCLH), Королевский колледж больницы (KCH), Гай и Сент-Томас “(GSTT), и Мерси Уход NHS Trusts. Эти трасты без таких, как платформа может использовать онлайн-версию калькулятора риска(http://psychosis-risk.net),или построить этот протокол с нуля на основе этой рукописи и наших онлайн-документов. Хотя этот протокол разработан для обнаружения риска психоза, архитектурная конструкция этого протокола не привязана к данному конкретному случаю использования. Протокол является достаточно гибким, чтобы обеспечить реконфигурацию и повторное настройку компонентов мониторинга и оповещения в режиме реального времени для других областей измерения риска, таких как побочные реакции на лекарства, что позволяет врачам своевременно принимать меры по улучшению ухода за пациентами, безопасности и опыта.
The authors have nothing to disclose.
Это исследование финансируется и является прямым выходом Королевского колледжа Лондона Доверие к концепции награду от Медицинского исследовательского совета (MRC) (MC_PC_16048) в PFP. RD и AR были поддержаны: а) благотворительность Модсли; b) Биомедицинский исследовательский центр Национального института медицинских исследований (НИПЧ) в южном Лондоне и Фонд Модсли NHS Trust и Королевский колледж Лондона; c) исследование данных в области здравоохранения Великобритании, которое финансируется Советом по медицинским исследованиям Великобритании, Советом по исследованиям в области инженерных и физических наук, Советом по экономическим и социальным исследованиям, Министерством здравоохранения и социальной помощи (Англия), главным научным управлением Шотландского государственного управления здравоохранения и социального обеспечения, Отделом исследований и развития здравоохранения и социальной помощи (правительство Уэльса), Агентством общественного здравоохранения (Северная Ирландия), Британским фондом сердца и Фондом здоровья; d) консорциум BigData@Heart, финансируемый Запорожской инициативой по инновационным лекарственным средствам-2 в рамках соглашения о предоставлении субсидий No 116074. Это совместное предприятие получает поддержку от научно-исследовательской и инновационной программы Европейского союза «Горизонт 2020» и EFPIA; она возглавляется DE Grobbee и SD Anker в партнерстве с 20 академическими и отраслевыми партнерами и ESC; и e) Национальный институт медицинских исследований Университетского колледжа Лондонского больничного исследовательского центра. Эти финансовые органы не играют никакой роли в разработке исследования, сбора и анализа. Высказанные мнения являются мнениями автора (ы) и не обязательно мнения ГСЗ, NIHR или Департамента здравоохранения.
CogStack-Pipeline | King's College London | Open source software | |
Elasticsearch | Elastic NV | Open Source Search & Analytics | |
Kibana | Elastic NV | Open source data visualization plugin for Elasticsearch | |
Python packages ("elasticsearch", "elasticsearch_dsl", "pandas" and "numpy") | Open source community | Open source packages |