Сепсис - это опасное для жизни состояние, вызванное чрезмерной реакцией организма на инфекцию, которая приводит к отказу органов или даже смерти. Поскольку сепсис может убить пациента даже за один час, прогноз выживаемости является неотложным приоритетом для медицинского сообщества: даже если лабораторные тесты и больничные анализы могут предоставить информативную информацию о пациенте, на самом деле они могут не прийти вовремя, чтобы позволить медицинское обслуживание. врачи должны распознать непосредственную опасность смерти и лечить ее должным образом. В этом контексте машинное обучение может быть полезно для прогнозирования выживаемости пациентов в течение нескольких минут, особенно когда оно применяется к нескольким легко восстанавливаемым медицинским функциям. В этом исследовании мы показываем, что можно достичь этой цели, применяя алгоритмы вычислительного интеллекта к трем характеристикам пациентов с сепсисом, зарегистрированным при поступлении в больницу: пол, возраст,и номер септического эпизода. Мы применили несколько методов интеллектуального анализа данных к когорте из 110204 госпитализированных пациентов и получили высокие оценки прогнозов как для этого полного набора данных (область максимального точного отзыва под кривой PR AUC = 0,966), так и для его подмножества, связанного с недавним сепсисом-3. определение (верхний PR AUC = 0,860). Кроме того, мы протестировали наши модели на внешней проверяемой когорте из 137 пациентов и достигли хороших результатов и в этом случае (верхний PR AUC = 0,863), что подтвердило обобщаемость нашего подхода. Наши результаты могут иметь огромное влияние на клинические условия, позволяя врачам прогнозировать выживаемость пациентов только по полу, возрасту и количеству септических эпизодов.и получил высокие оценки прогноза как на этом полном наборе данных (верхняя область точности-отзыва под кривой PR AUC = 0,966), так и на его подмножестве, связанном с недавним определением сепсиса-3 (верхнее значение PR AUC = 0,860). Кроме того, мы протестировали наши модели на когорте внешней проверки из 137 пациентов и достигли хороших результатов и в этом случае (верхний PR AUC = 0,863), что подтвердило обобщаемость нашего подхода. Наши результаты могут иметь огромное влияние на клинические условия, позволяя врачам прогнозировать выживаемость пациентов только по полу, возрасту и количеству септических эпизодов.и получил высокие оценки прогноза как для этого полного набора данных (область максимальной точности-отзыва под кривой PR AUC = 0,966), так и для его подмножества, связанного с недавним определением сепсиса-3 (верхнее значение PR AUC = 0,860). Кроме того, мы протестировали наши модели на когорте внешней проверки из 137 пациентов и достигли хороших результатов и в этом случае (верхний PR AUC = 0,863), что подтвердило обобщаемость нашего подхода. Наши результаты могут иметь огромное влияние на клинические условия, позволяя врачам прогнозировать выживаемость пациентов только по полу, возрасту и количеству септических эпизодов.подтверждая обобщаемость нашего подхода. Наши результаты могут иметь огромное влияние на клинические условия, позволяя врачам прогнозировать выживаемость пациентов только по полу, возрасту и количеству септических эпизодов.подтверждая обобщаемость нашего подхода. Наши результаты могут иметь огромное влияние на клинические условия, позволяя врачам прогнозировать выживаемость пациентов только по полу, возрасту и количеству септических эпизодов.

Вступление

Сепсис - это опасное состояние, вызванное чрезмерной реакцией иммунной системы на инфекцию. По оценкам Всемирной организации здравоохранения (ВОЗ), сепсис ежегодно поражает более 30 миллионов человек во всем мире, вызывая около 6 миллионов смертей 1 и вызывая расходы, связанные со здравоохранением, на сумму более 24 миллиардов долларов США ежегодно только в Соединенных Штатах 2. Научное сообщество все еще изучает этиологию сепсиса 3, в то время как его лечение 4,5,6 проблематично из-за высокой сложности и неоднородности заболевания 7,8. Еще один фактор сложности заключается в более строгом определении сепсиса, введенном в 2016 г. 9; новое определение, названное Сепсис-3 10, теперь требует наличия дополнительных органных дисфункций, чтобы это состояние было обозначено как сепсис. Хотя полезность Sepsis-3 была недавно подтверждена 11,это все еще обсуждается в медицинском сообществе 12. Кроме того, раннее обнаружение имеет решающее значение для управления атакой и получения благоприятного исхода, поскольку сепсис может убить пациента всего за час.

Прогноз выживаемости больных сепсисом

Медицинская литература изобилует статьями общего назначения по сепсису 13, а поиск биомаркеров в клинических условиях длился несколько десятилетий, и статьи начала семидесятых годов все еще актуальны 14. Первоначально ядро ​​исследований было сосредоточено на клинических испытаниях, направленных на выявление терапевтических факторов, представляющих потенциальные цели для новых или перепрофилированных лекарств. Решающее изменение темпов исследования произошло в начале 2000-х годов, когда стали доступны широкие эпидемиологические данные, что привело к появлению крупных ретроспективных исследований 2,15. Действительно, такой недавний приток данных привел к постоянному потоку медицинских и компьютерных исследований, в которых исследователи использовали различные методы науки о данных, чтобы найти связи между клиническими факторами и исходами сепсиса, причем выживаемость пациентов была одним из наиболее важных.Внося свой вклад в развитие ландшафта, сообщество практикующих врачей начало внедрять различные системы раннего предупреждения, такие как системы физиологического мониторинга для выявления пациентов с острым ухудшением состояния 16. Небольшая группа показателей быстро завоевала популярность в клинических условиях, став, таким образом,де-фактостандарты для сравнительных исследований: APACHE 17, SAPS 18, SOFA 19 и qSOFA оценка 10. В дополнение к таким установившимся общим ожогам сообщества в последнее время в литературе были определены различные формулы, включающие альтернативные переменные: например, динамическое пульсовое давление и вазопрессор (DPV), дельта-пульсовое давление (\ (\ Delta \) PP) 20 и Шкала госпитальной смертности от сепсиса (SHMS) 21. Однако, хотя шкалы раннего предупреждения получили широкое распространение, имеется лишь ограниченное количество доказательств их эффективности в улучшении результатов лечения пациентов 16. Среди всех статистических методов алгоритмы, основанные на многофакторной регрессии (Кокса) по клиническим переменным, играли ключевую роль 22,23, начиная с ранних лет 24 и до наших дней 25. Примечательно, что особенности этих методов не ограничиваются клиническими переменными:за последние несколько лет ряд команд попробовали альтернативные элементы из современных омиксных технологий, такие как метаболомика 26, геномика SNP 27, циркулирующая микроРНК 28, метаболиты крови 29 или апоптоз лимфоцитов 30, часто в сочетании с более классическими биомаркерами и сравниваемые с разными оценками . К сожалению, эти статистические подходы оказались довольно ограниченными по своей эффективности, и лишь небольшая часть исследований достигла приемлемого уровня эффективности 31. Действительно, Гвадри-Шридхар и его коллеги 32 заявили о превосходстве деревьев решений над методами регрессии еще в 2010 году.часто сочетается с более классическими биомаркерами и сравнивается с разными оценками. К сожалению, эти статистические подходы оказались довольно ограниченными по своей эффективности, и лишь небольшая часть исследований достигла приемлемого уровня эффективности 31. Действительно, Гвадри-Шридхар и его коллеги 32 заявили о превосходстве деревьев решений над методами регрессии еще в 2010 году.часто сочетается с более классическими биомаркерами и сравнивается с разными оценками. К сожалению, эти статистические подходы оказались довольно ограниченными по своей эффективности, и лишь небольшая часть исследований достигла приемлемого уровня эффективности 31. Действительно, Гвадри-Шридхар и его коллеги 32 заявили о превосходстве деревьев решений над методами регрессии еще в 2010 году.

Сепсис и машинное обучение

В последнее время машинное обучение стало основным игроком в прогнозном анализе данных о сепсисе, что привело к огромной волне исследований, направленных на различные аспекты проблемы, от общей проблемы 33,34,35,36,37,38,39,40 , 41,42,43,44,45,46,47,48,49,50,51, для более конкретных целей или методов. Например, во многих исследованиях определялись, объединялись и подтверждались балльные риски 52,53, прогнозировалось раннее начало 54,55,56 или уделялось внимание педиатрическим аспектам 57 или непосредственному применению в клинической практике 58,59,60. Появились также лонгитюдные исследования 61,62,63 вместе с методами, объединяющими альтернативные источники данных, такие как omics 64 и другие. В конце 2010-х революция вычислительного интеллекта также вышла на игровую площадку, и подходы к глубокому обучению наводнили специализированные журналы 65,66,67,68,69,70,71,72,73,также учитывая вопрос интерпретируемости 74,75. Fleuren et al. 76 опубликовали исчерпывающий обзор различных аспектов. Как упоминалось ранее, многие из этих исследований стали возможными благодаря общедоступности тщательно отобранных наборов клинических данных, связанных с сепсисом. Среди этих наборов данных мы отмечаем инициативу 77,78 Surviving Sepsis Campaign (хотя и не полностью обнародованы), базу данных Medical Information Mart for Intensive Care (MIMIC-III) 79 и базу данных совместных исследований электронного отделения интенсивной терапии (eICU) 80 , которые отстаивают свою полноту и целостность. Кроме того, стоит упомянуть некоторые известные исследования, направленные на выявление ограниченного числа признаков выживаемости при сепсисе 81,82: например, шесть предикторов Мао и его коллег 83,84, пять основных прогностических признаков Shukeri et al. 85,и три биомаркера крови Долина с соавторами 86.

Эта учеба

В данной рукописи мы применяем аналогичный подход: наша движущая цель - предсказание бинарной выживаемости в большой когорте норвежских пациентов, первоначально представленных и опубликованных Knoop и его коллегами 87. В дополнение к этой прогностической задаче в качестве отличительной черты мы также стремимся доказать, что минимальный набор предикторов может адекватно предсказать статус выживаемости. Чтобы еще раз подтвердить обоснованность нашего подхода, мы показываем, что наш подход также может быть применен к внешнему южнокорейскому набору данных, имеющему те же клинические особенности, который мы используем в качестве валидационной когорты. В качестве основного результата таких поисков и улучшений по сравнению с опубликованной литературой мы обнаружили, что единственный клинический фактор, а именно эпизод прогрессирующей госпитализации, в сочетании с двумя основными личностными элементами - возрастом и полом, -может эффективно прогнозировать выживаемость пациентов. Примечательно, что мы провели анализ как по всей когорте, первоначально называвшейсяпервичная когорта, соответствующая госпитализации пациентов, затронутых потенциальными предпосылками сепсиса (определение до сепсиса-3), и на подмножестве данных, включая только госпитализации пациентов, определенных новым определением сепсиса-3, называемую исследуемой когортой. Затем мы полностью повторили тот же анализ на когорте валидации и, наконец, обучили наши модели на первичной когорте и когорте исследования, чтобы впоследствии применить их к когорте валидации. Мы впервые показываем, что можно применить машинное обучение к полу, возрасту и количеству септических эпизодов, собранных из истории болезни госпитализации, для прогнозирования выживаемости пациентов с сепсисом. Наш очень небольшой набор обнаруженных предикторов представляет собой разумный компромисс между точностью и простотой модели, требуя немного ресурсов в качестве собранных данных. Этот баланс имеет решающее значение при рассмотрении вопроса о переводе в клиническую практику, которая, особенно при лечении сепсиса, редко бывает успешной 58 и не легко интегрируется с деятельностью клиницистов 88. Хотя в литературе появился ряд предложений по цифровой обработке 89,Например, влияние сепсиса, одобренное Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA) 90, еще далеко от широкого распространения, и, возможно, наиболее известной из них является система прогнозирования сепсиса и оптимизации терапии (SPOT) 91. пример. Учитывая это, наличие простого, но точного прогностического теста на выживаемость пациентов, представленного здесь, является многообещающим первым шагом на пути к разработке инструмента на основе машинного обучения, поддерживающего врачей в повседневной практике.Представленный здесь простой, но точный прогностический тест на выживаемость пациентов является многообещающим первым шагом на пути к разработке инструмента на основе машинного обучения, поддерживающего врачей в повседневной практике.Представленный здесь простой, но точный прогностический тест на выживаемость пациентов является многообещающим первым шагом на пути к разработке инструмента на основе машинного обучения, поддерживающего врачей в повседневной практике.

Остальную часть рукописи мы организовали следующим образом. После этого Введения мы описываем проанализированный набор данных (Наборы данных) и полученные нами результаты (Результаты). После этого мы обсуждаем влияние и последствия наших результатов, а также ограничения и дальнейшее развитие исследований (Обсуждение) и описываем используемые нами методы. ((Методы).

Наборы данных

Первичная когорта и когорта исследования

Мы проанализировали набор данных, состоящий из 110 204 случаев госпитализации 8 811 пациентов в период с 2011 по 2012 годы в Норвегии, у которых были диагностированы инфекции, синдром системного воспалительного ответа (SIRS), сепсис, вызванный возбудителями микробов, или септический шок 87. Данные взяты из Норвежского регистра пациентов 92 и Агентства Статистического управления Норвегии 93.

Для каждого госпитализированного пациента набор данных содержит пол, возраст, номер септического эпизода, исход госпитализации (выживаемость), продолжительность пребывания (LOS) в больнице и один или несколько кодов Международной классификации болезней 10-го пересмотра (МКБ-10). с описанием заболевания пациента (таблица 1). Поскольку основная цель этого исследования - предсказать выживаемость пациента, мы отказались от продолжительности пребывания, поскольку она сильно зависит от вероятности выживания: чем дольше пациент должен оставаться в больнице, тем меньше вероятность того, что он / она будет оставаться в больнице. выживать. Переменная выживаемости относится к продолжительности пребывания в больнице, которая колеблется в интервале [0, 499] дней и имеет среднее значение 9,351 дня. Таким образом, наш прогноз относится к вероятности выживания или смерти пациента в течение 9,351 дня после сбора его / его медицинской карты в больнице.

Поступили 57 973 мужчины и 52 231 женщина в возрасте от 0 до 100 лет (Таблица 2 и Таблица 3). Большинство обращений (76,96%) относятся к первому септическому эпизоду. Более подробную информацию о наборе данных можно найти в исходном исследовании 87.

Кураторы оригинального набора данных Knoop et al. 87 назвал полный набор данных с 110 204 поступившими пациентами первичной когортой. Из первичной когорты они выбрали госпитализации, соблюдающие определение сепсисас сепсисом-3(по крайней мере, один код МКБ-10, связанный с несколькими инфекциями или сепсисом, и по крайней мере один код для острой органной дисфункции) 9, и они назвали эту подгруппу когортой исследования..

Поскольку данные первичной когорты были записаны до того, как в 2016 году появилось определение сепсиса-3, мы не можем знать, действительно ли у пациента, у которого был диагностирован код МКБ-10, связанный с сепсисом, впоследствии действительно была органная дисфункция. Следовательно, мы не можем знать, можно ли считать эти поступления связанными с сепсисом в соответствии с текущим определением Sepsis-3 сегодня. Напротив, мы знаем, что состояния первичной когорты (инфекции, синдром системного воспалительного ответа (SIRS), сепсис, вызванный возбудителями микробов или септический шок) могли привести к сепсису. Чтобы отразить эту информацию, мы называем эти состояния потенциальными предпосылками сепсиса.в этом исследовании. Мы решили рассмотреть как первичную когорту, так и когорту исследования для нашего анализа, потому что медицинское сообщество еще не достигло консенсуса по единому определению сепсиса 94.

Мы взяли исходный набор данных 95 и применили тот же выбор, создав когорту исследования, размер которой отличается от размера группы Knoop et al. 87: в то время как их когорта исследования состояла из 18 460 госпитализированных пациентов, наша когорта исследования насчитывала 19051 человек. К сожалению, нам не удалось получить исходное подмножество когорты исследования от Knoop.

И основная когорта, и когорта нашего исследования имеют положительный дисбаланс (таблица 2). Первичная когорта включает 102 099 случаев госпитализации выживших пациентов (92,65% положительных результатов) и 8 105 случаев госпитализации умерших пациентов (7,35% отрицательных результатов). Наша когорта исследования включает 15 445 случаев госпитализации выживших пациентов (81,07% положительных результатов) и 3606 случаев госпитализации умерших пациентов (18,93% отрицательных результатов).