우울증 에피소드 감지
웨어러블 센서의 활동량, 수면, HR/HRV, 사회적 상호작용 데이터를 활용하여 우울증 에피소드를 자동 감지하고 임상 면담/PHQ-9를 보완 또는 대체하는 기술
개요
- 입력 시그널: 활동량 감소, 수면 패턴 변화, HR/HRV 변동, 사회적 상호작용 감소 (통화/문자 빈도, GPS 이동 반경)
- 대체 대상: 임상 면담 / PHQ-9 자가보고 설문
- 현재 성숙도: 연구 단계 (정확도 79~90%), 일부 대규모 관찰 연구 프로토콜 진행 중. 임상 대체까지는 아직 거리가 있으며 보완 도구로 포지셔닝
주요 연구 및 논문
1. Systematic Review and Meta-Analysis of Wearable AI in Depression (Gupta et al., 2023)
- 출처: npj Digital Medicine
- 핵심 내용: 비침습적 웨어러블(스마트워치, 스마트밴드 등)에서 수집된 데이터를 활용한 우울증 감지/예측 AI 알고리즘을 체계적으로 검토한 메타분석. 스마트워치, 스마트글래스, 스마트의류 등 다양한 온바디 웨어러블 연구를 포괄적으로 분석했다.
- 방법론: PRISMA 가이드라인에 따른 체계적 문헌 고찰 및 메타분석
- 주요 결과: 심박수(48%), 운동지표(36%), 걸음 수(33%)가 가장 빈번하게 사용된 피처로, 정신운동 지연과 관련된 핵심 우울 증상과 강한 상관관계를 보임
- 의의: 웨어러블 AI 기반 우울증 감지 분야의 첫 번째 대규모 메타분석으로, 향후 연구 방향의 기준점을 제시
2. Passive Sensing for Mental Health Monitoring: Scoping Review (JMIR, 2025)
- 출처: Journal of Medical Internet Research
- 핵심 내용: 7개 데이터베이스(Web of Science, PubMed, IEEE Xplore 등)에서 2015~2025년 발행된 42개 연구를 분석한 스코핑 리뷰. 수동 센싱 기반 정신건강 모니터링의 현황을 정리했다. 연구의 55%가 우울증, 21%가 불안에 초점을 맞추었다.
- 방법론: 주로 손목 착용 기기(76%) 사용, 심박수(67%), 운동지표(60%), 걸음 수(40%)를 핵심 바이오마커로 활용
- 주요 결과: CNN-LSTM 모델이 불안 감지에서 92.16% 정확도 달성. 그러나 방법론적 이질성(76% 단일기기 연구, 45%가 7일 미만 모니터링)과 소규모 샘플(중앙값 60.5명) 한계 존재
- 의의: 임상 적용을 위해 3개월 이상의 종단 연구, 표준 프로토콜, 데이터 프라이버시 프레임워크가 필요하다는 점을 명확히 제시
3. Mood Episode Prediction Using Wearable Sleep and Circadian Rhythm Features (npj Digital Medicine, 2024)
- 출처: npj Digital Medicine
- 핵심 내용: 기분장애 환자에서 웨어러블로 수집한 수면 및 일주기 리듬 데이터만으로 기분 에피소드를 예측하는 모델. 다양한 데이터 유형이 필요한 기존 모델의 한계를 극복하여 실제 임상 적용 가능성을 높였다.
- 방법론: 수면 시간, 수면 단계, 일주기 리듬 관련 디지털 표현형 데이터를 활용한 ML 모델
- 주요 결과: 수면/일주기 리듬 피처만으로도 3일 이내 기분 에피소드 발생을 유의미하게 예측
- 의의: 심박수나 활동량 없이 수면 데이터만으로도 예측이 가능하다는 점에서 소비자용 기기(예: Oura Ring)로의 확장 가능성 시사
4. Wearable Device and ML to Predict Mood Symptoms in Bipolar Disorder (JMIR Medical Informatics, 2025)
- 출처: JMIR Medical Informatics
- 핵심 내용: 양극성 장애 환자 24명을 대상으로 스마트워치 데이터와 6개 ML 알고리즘을 활용하여 우울/조증 에피소드를 예측했다. BDI와 YMRS를 기준 척도로 사용했다.
- 방법론: 스마트워치에서 운동활동(걸음 수, 거리, 오른 층수), 수면(총 수면, 깊은/얕은/REM 수면), 심박수(최소/최대/평균/안정시) 피처 추출 후 6개 ML 모델 학습
- 주요 결과: 우울 증상 예측 모델이 83% 정확도, 0.89 AUROC, 0.65 F1 달성
- 의의: 소비자용 스마트워치만으로 임상적으로 유의미한 예측 성능을 달성한 실증 연구
5. Depression Recognition Using Daily Wearable-Derived Physiological Data (Sensors, 2025)
- 출처: Sensors (MDPI)
- 핵심 내용: 임상 진단된 우울증 환자 58명과 건강 대조군 58명으로부터 6시간 동안 맥파, 피부전도도, 3축 가속도 데이터를 수집하여 우울증 인식 모델을 구축했다.
- 방법론: Random Forest 알고리즘, 일상 활동 중 비침습적 데이터 수집
- 주요 결과: 6시간 데이터로 90.0%, 2시간 84.7%, 30분 80.1%, 5분 76.0% 분류 정확도 달성
- 의의: 짧은 시간의 센서 데이터로도 상당한 정확도를 달성할 수 있음을 보여주며, 실시간 선별검사의 가능성을 시사
6. Explainable AI for Depression Detection from Activity Data (JMIR Mental Health, 2025)
- 출처: JMIR Mental Health
- 핵심 내용: 웨어러블 액티그래피 데이터로 우울증 감지 및 심각도 분류를 수행하되, SHAP/LIME 기반 설명가능 AI를 적용하여 임상 수용성을 높인 프레임워크를 개발했다.
- 방법론: Depresjon 데이터셋, ADASYN으로 클래스 불균형 처리, LR/SVM/RF/XGBoost/신경망 5개 모델 비교, SHAP와 LIME으로 피처 해석
- 주요 결과: 파워스펙트럼 밀도 평균, 자기상관, 인구통계학적 피처가 핵심 예측인자로 확인
- 의의: 설명가능 AI(XAI) 적용을 통해 임상의가 모델 예측 근거를 이해할 수 있어, 실제 임상 워크플로에 통합 가능성 향상
7. Detection of Depressive Symptoms in College Students via Multimodal Passive Sensing (JMIR Formative Research, 2025)
- 출처: JMIR Formative Research
- 핵심 내용: 대학생 28명을 대상으로 Oura Ring(수면/생리), Samsung 스마트워치(생리/움직임), AWARE 앱(스마트폰 패시브 센싱)을 조합하여 우울 증상을 감지한 멀티모달 연구
- 방법론: LightGBM 알고리즘, 다중 기기 멀티모달 데이터 융합
- 주요 결과: 멀티모달 피처가 단일 모달 피처보다 우울증 감지 성능에서 우수한 결과를 보임
- 의의: 복수 소비자용 기기 조합의 실용성을 검증한 연구
8. SWARTS-DA 관찰 연구 프로토콜 (고려대학교 안암병원, 2024~)
- 출처: PMC
- 핵심 내용: 스마트폰 및 스마트워치 기반 디지털 표현형을 활용한 우울/불안 선별 모델 개발을 위한 대규모 한국 관찰 연구. 최대 2,500명 참여자를 목표로 2024년 4월 모집 시작
- 방법론: 4주간 스마트폰 앱 능동 데이터 + 스마트폰/스마트워치 수동 센싱 데이터 수집
- 주요 결과: 진행 중 (한국인 대상 첫 대규모 디지털 표현형 연구)
- 의의: 한국 인구를 대상으로 한 대규모 검증 연구로, 국내 서비스 적용에 직접적인 근거 제공 가능
상용화 동향
- Fitbit/Google: Fitbit Sense의 EDA 센서와 스트레스 관리 점수를 통해 간접적 정신건강 모니터링 제공. Google Health Studies를 통한 연구 데이터 수집
- Apple: Apple Watch의 HealthKit 정신건강 API(mindful minutes, mood logging) 지원. watchOS에 기분 기록 기능 추가
- Oura: 수면 및 HRV 데이터 기반 '레디니스 점수' 제공. 연구 목적으로 다수 우울증 연구에 활용
- Feel Therapeutics: 디지털 정밀 정신건강 모니터링 플랫폼으로, 웨어러블 기반 객관적 모니터링을 표방
- Mindstrong (폐업): 스마트폰 터치스크린 상호작용 패턴으로 인지/정서 상태 추론을 시도했으나 2023년 폐업. 디지털 정신건강 상용화의 어려움을 보여주는 사례
한계 및 과제
- 소규모 샘플: 대부분의 연구가 중앙값 60명 수준의 소규모 코호트에서 진행. 일반화 가능성 제한
- 짧은 모니터링 기간: 45%의 연구가 7일 미만 모니터링으로, 자연적 변동을 포착하기 어려움
- 방법론적 이질성: 기기, 센서, 피처 추출, ML 모델이 연구마다 상이하여 결과 비교가 어려움
- PHQ-9 기준 한계: PHQ-9 자체가 자가보고 도구이므로 ground truth로 사용할 때 바이어스 존재
- 개인화 vs 범용 모델: 개인화 모델이 범용 모델보다 우수하나, 콜드스타트 문제와 확장성 제한
- 프라이버시/윤리: 지속적 행동 모니터링에 대한 동의, 데이터 보안, 차별 우려. 14%의 연구만 익명화를 다룸
- 규제 경로: 우울증 감지 웨어러블에 대한 FDA/CE 인허가 경로가 아직 명확하지 않음
참고 자료
- npj Digital Medicine - Systematic Review (2023) · 원문
- JMIR - Passive Sensing Scoping Review (2025) · 원문
- npj Digital Medicine - Mood Episode Prediction (2024) · 원문
- JMIR Medical Informatics - Bipolar Disorder Prediction (2025) · 원문
- Sensors - Depression Recognition (2025)
- JMIR Mental Health - Explainable AI (2025) · 원문
- JMIR Formative Research - College Students Multimodal (2025) · 원문
- MDPI Algorithms - Scoping Review (2024)
- medRxiv - Digital Phenotyping (2025)
- PLOS ONE - Elderly Depression Passive Sensing (2024)