패혈증 조기 경고 (입원 환자)
입원 환자의 HR, HRV, 체온, 호흡수의 급격한 변화 패턴을 ML로 분석하여 혈액배양/바이탈 기반 진단보다 수시간~수일 앞서 패혈증을 예측하는 기술
개요
- 입력 시그널: 심박수(HR) 급변, HRV 급격 저하, 체온 변동, 호흡수 상승, SpO2 변화 패턴
- 대체 대상: 혈액배양 검사 + 바이탈 사인 기반 임상 스코어 (SOFA, qSOFA, SIRS, NEWS/MEWS)
- 현재 성숙도: ML 모델이 기존 임상 스코어를 압도적으로 능가 (AUC 0.83~0.97 vs 0.60~0.73). 다수 전향적 임상 연구 완료. TREWS(Johns Hopkins)는 미국 수십 개 병원에서 운영 중이며 사망률 18% 감소 입증. Sepsis ImmunoScore는 2024년 FDA De Novo 승인 획득. 웨어러블 기반 비ICU 환경 확장 연구 진행 중
주요 연구 및 논문
1. TREWS — Prospective Multi-Site Study of Patient Outcomes (Adams et al., 2022)
- 출처: Nature Medicine
- 핵심 내용: Johns Hopkins 대학에서 개발한 TREWS(Targeted Real-Time Early Warning System)의 전향적 다기관 임상 연구. 5개 병원에서 590,736명의 환자를 모니터링하고, 항생제 투여 전 TREWS가 식별한 6,877명의 패혈증 환자를 분석했다.
- 방법론: 전자의무기록(EHR) 데이터를 실시간으로 분석하는 ML 모델. 764,707건의 환자 방문(17,538건 패혈증) 데이터로 학습
- 주요 결과: 경고 확인 후 3시간 내 대응 시 원내 사망률 3.3%p 절대 감소(18.7% 상대 감소). 첫 항생제 처방까지 중앙값 1.85시간 단축. AUC 0.97, 민감도 82%, 리드타임 5.7시간. 임상의 채택률 89%
- 의의: AI 기반 패혈증 조기 경고 시스템의 가장 대규모이고 엄밀한 전향적 검증. 실제 사망률 감소를 입증한 최초의 다기관 연구
2. TREWS — 2025년 확장 배포 및 영향 (Saria, 2025)
- 출처: Johns Hopkins Hub
- 핵심 내용: TREWS 개발자 Suchi Saria가 설립한 Bayesian Health를 통해 미국 수십 개 병원으로 확장 배포. 연간 약 270,000명이 사망하는 패혈증에 대해 18% 사망률 감소를 달성하고 있다.
- 방법론: 구조화된 데이터(검사, 바이탈)와 비구조화된 데이터(의사 노트)를 모두 분석하는 종합 ML 시스템
- 주요 결과: 임상의 채택률 90%, 사망률 18% 감소. 응급실 입원부터 퇴원까지 핵심 임상 워크플로를 지원
- 의의: 학술 연구에서 상용 플랫폼으로의 성공적 전환 사례. NSF SBIR 그랜트를 통해 패혈증 외 다른 중증 질환으로 확장 예정
3. Early Detection of Sepsis Using ML: Network Meta-Analysis (Frontiers in Medicine, 2024)
- 출처: Frontiers in Medicine
- 핵심 내용: 73개 연구를 대상으로 한 네트워크 메타분석으로, ML 모델과 기존 임상 스코어(SOFA, qSOFA, NEWS, MEWS, SIRS, SAPS II)의 패혈증 예측 성능을 직접 비교했다.
- 방법론: 73개 연구의 네트워크 메타분석, 공통 비교 프레임워크에서 AUC 산출
- 주요 결과: ML 모델 통합 AUC 0.825 (95% CI 0.809~0.840). 비교: SOFA 0.667, qSOFA 0.612, NEWS/NEWS2 0.719, MEWS 0.651, SIRS 0.666, SAPS II 0.662. 모든 ML 모델이 기존 스코어 대비 유의미하게 우수
- 의의: ML이 기존 임상 스코어를 능가한다는 것을 가장 대규모 메타분석으로 확인. 향후 연구와 임상 도입의 핵심 레퍼런스
4. SEPSI Score — ML for Sepsis Detection Across All Hospital Departments (Valenciennes Hospital, 2025)
- 출처: PMC
- 핵심 내용: 프랑스 Valenciennes 병원의 전체 진료과 환자 45,127명 데이터로 훈련한 그래디언트 부스팅 트리 기반 패혈증 예측 모델(SEPSI Score). ICU뿐 아니라 일반 병동까지 적용 범위를 확장한 점이 차별점이다.
- 방법론: Gradient Boosted Trees, 45,127명 후향적 데이터, 전체 진료과 포괄
- 주요 결과: 패혈증 발생 3시간 전까지 SOFA, qSOFA, SIRS, MEWS보다 일관되게 높은 AUROC. AUPR에서도 SEPSI 0.738 vs SOFA 0.174, qSOFA 0.036으로 압도적 차이
- 의의: ICU 중심의 기존 연구를 넘어 전체 병원 환경으로 패혈증 조기 경고를 확장. 소수 클래스 지표(AUPR)의 중요성을 강조
5. SepAl — Sepsis Alerts on Low-Power Wearables with TinyML (Giordano et al., 2025)
- 출처: IEEE Sensors Journal / arXiv
- 핵심 내용: PPG, IMU, 체온 센서만을 사용하는 저전력 웨어러블 기기에서 온디바이스로 패혈증을 예측하는 경량 시간 합성곱 신경망(Temporal CNN). 6개의 디지털 바이탈 사인만으로 기존 랩 검사 없이 패혈증 예측이 가능함을 입증했다.
- 방법론: Temporal CNN, 양자화(INT8)하여 ARM Cortex-M33 마이크로컨트롤러에 배포. PPG/IMU/체온의 6개 디지털 바이탈 사인만 사용
- 주요 결과: 패혈증 발생 중앙값 9.8시간 전 경고. 추론 효율 0.11 MAC/Cycle, 지연시간 143ms, 추론당 에너지 2.68mJ
- 의의: 웨어러블 기기 위에서 실시간 패혈증 예측을 실행하는 최초의 TinyML 구현. 비ICU/저자원 환경에서의 활용 가능성을 열었으며, 랩 검사 없이 디지털 바이오마커만으로 패혈증 감지가 가능함을 입증
6. Improving ML-Based Sepsis Diagnosis Using Heart Rate Variability (Bhamidipati et al., 2024)
- 출처: arXiv
- 핵심 내용: HRV 피처만으로 패혈증을 진단하는 ML 모델을 개발하고, 정밀도 특화 모델과 재현율 특화 모델을 결합한 앙상블 전략을 제안한 연구. 통계적 부트스트래핑과 Boruta 알고리즘으로 핵심 HRV 피처를 선별했다.
- 방법론: XGBoost, Random Forest 분류기 + Neural Network. Boruta 알고리즘 기반 피처 선택, 정밀도/재현율 특화 모델의 수동 앙상블
- 주요 결과: 신경망 모델 F1=0.805, 정밀도=0.851, 재현율=0.763. 앙상블 합의 시 재현율 0.825 달성. HRV 피처만으로 최신 모델 수준의 성능 확인
- 의의: HRV 단독으로도 다중 바이탈 사인 기반 모델에 필적하는 패혈증 감지가 가능함을 입증. 웨어러블에서 ECG/PPG만으로 HRV를 추출하여 패혈증을 예측하는 단순화된 파이프라인의 실현 가능성 제시
7. Early Prediction of Sepsis Using Heart Rate Signals with Genetic Optimized LSTM (2025)
- 출처: arXiv
- 핵심 내용: 웨어러블 기기의 심박수 신호만을 사용하여 비ICU 환경에서 패혈증을 예측하는 4개 ML 모델(LGB, MLP, LSTM, LSTM-FCN)을 유전 알고리즘으로 아키텍처를 최적화한 연구. 실시간 데이터 처리의 계산 효율성과 메모리 요구량 최소화에 초점을 맞추었다.
- 방법론: LGB, MLP, LSTM, LSTM-FCN의 4개 모델 아키텍처를 유전 알고리즘으로 최적화. 웨어러블 배포를 고려한 경량화
- 주요 결과: 패혈증 치료 1시간 지연 시 사망 확률 4~8% 증가라는 임상적 배경 하에, 웨어러블 심박수 데이터만으로 유의미한 예측 성능 달성
- 의의: 비ICU 환경(일반 병동, 가정)에서의 패혈증 모니터링 가능성을 심박수 단일 입력으로 확장
8. Sepsis ImmunoScore — FDA De Novo 승인 (Prenosis, 2024)
- 출처: NEJM AI
- 핵심 내용: 2024년 4월 FDA De Novo 경로로 승인된 최초의 AI 패혈증 진단 도구. 인구통계, 바이탈 사인, 대사 패널, 전혈구 검사, 젖산, PCT, CRP 등 최대 22개 파라미터를 분석하여 4단계 위험 층화 점수를 산출한다.
- 방법론: 22개 입력 파라미터(인구통계 + 바이탈 + 대사/혈구 패널 + 바이오마커) 기반 ML 알고리즘
- 주요 결과: 패혈증 및 원내 사망률, 재원 기간, ICU 입원, 기계 환기, 승압제 투여의 24시간 내 예측에서 높은 성능
- 의의: AI 기반 패혈증 도구 최초의 FDA 승인으로, 규제 경로의 선례를 확립. 다만 랩 검사 결과를 필요로 하므로 순수 웨어러블 기반은 아님
9. COMPOSER — Emergency Department Clinical Trial (UC San Diego, 2024)
- 출처: UC San Diego Health News
- 핵심 내용: UC San Diego의 2개 응급실에서 6,217명을 대상으로 COMPOSER 딥러닝 모델의 효과를 전향적으로 평가한 임상 연구.
- 방법론: 딥러닝 기반 실시간 EHR 모니터링, 2개 응급실에서의 전향적 평가
- 주요 결과: 패혈증 관련 사망률 1.9% 감소(17% 상대 감소), 치료 프로토콜 준수율 5% 향상, 패혈증 발생 72시간 내 장기 손상(SOFA 점수) 감소
- 의의: 응급실이라는 고압 환경에서 AI 패혈증 도구의 실제 임상 효과를 입증. TREWS와 함께 실세계 배포의 선두 사례
상용화 동향
- Bayesian Health (TREWS): Johns Hopkins에서 스핀오프한 상용 플랫폼. 미국 수십 개 병원에서 운영 중. NSF SBIR 그랜트로 패혈증 외 질환 확장 예정
- Prenosis (Sepsis ImmunoScore): 2024년 FDA De Novo 승인. 최초의 AI 패혈증 진단 도구. 22개 파라미터 기반
- Dascena (InSight): 6개 바이탈 사인만으로 48시간 전 패혈증 예측. FDA 승인 획득. SIRS/SOFA 대비 우수한 정확도
- Epic Sepsis Model (ESM): 가장 널리 배포된 모델이나 AUC 0.63으로 성능이 낮아 비판 대상. TREWS(0.97)나 COMPOSER와 큰 성능 차이
- Philips IntelliVue Guardian: 의료기기 기반 연속 모니터링 + 조기 악화 감지. 패혈증 특화는 아니나 바이탈 이상 경고 기능 포함
한계 및 과제
- 위양성 비율: 일상 병원 환경에서 ML 모델 사용 시 경고의 80~90%가 위양성. 양성예측도(PPV)와 AUPR 지표의 중요성이 부각되고 있으나, 대부분의 연구가 AUC만 보고
- 경고 피로(Alert Fatigue): 높은 위양성률로 인한 임상의 경고 피로가 채택의 핵심 장벽. TREWS의 89~90% 채택률은 예외적 성과
- 외부 검증 부족: 대부분의 모델이 단일 기관 또는 소수 기관에서만 검증. 다양한 인구, 진료 환경, EHR 시스템에서의 일반화 검증 필요
- 인지 편향: 임상의가 젊은 환자나 피크 시간대에 경고를 무시하는 경향 등, AI 도구와의 상호작용에서 인지 편향이 성과에 영향
- 표준화 미비: 연구 간 패혈증 정의, 데이터셋, 성능 지표가 상이하여 직접 비교가 어려움. 공유 코드/데이터의 필요성 제기
- 웨어러블 vs 침상 모니터: 대부분의 검증된 시스템(TREWS, COMPOSER)은 EHR + 침상 모니터 데이터를 사용. 웨어러블 단독 기반(SepAl 등)은 아직 초기 연구 단계
- 랩 검사 의존성: Sepsis ImmunoScore 등 FDA 승인 도구도 혈액 검사 결과를 필요로 하여, 순수 비침습적 접근과는 거리가 있음
참고 자료
- Nature Medicine - TREWS Prospective Multi-Site Study (2022) · 원문
- Johns Hopkins Hub - TREWS 2025 Expansion (2025) · 원문
- Frontiers in Medicine - Network Meta-Analysis (2024) · 원문
- PMC - SEPSI Score Development and Validation (2025)
- arXiv - SepAl: TinyML Wearable Sepsis Alerts (2024/2025)
- arXiv - HRV-Based Sepsis Diagnosis (2024)
- arXiv - Genetic Optimized LSTM for Sepsis (2025) · 원문
- NEJM AI - Sepsis ImmunoScore FDA Authorization (2024) · 원문
- UC San Diego - COMPOSER Clinical Trial (2024)
- PMC - AI in Sepsis Management Overview (2025)