디지털 표현형으로 하지불안증후군을 객관적으로 예측할 수 있을까?
기본 정보
- 제목: Machine learning prediction model for restless legs syndrome based on wearable and smartphone digital phenotyping
- 저자: Jeong 외 다수
- 저널: Scientific Reports (Nature)
- 출판연도: 2025
- DOI: 10.1038/s41598-025-01215-8
- PMID: -
- 근거 수준: 코호트 연구
이 연구는 스마트폰 앱의 자가 보고 생활 데이터와 웨어러블 기기의 생체 데이터를 통합하여 일주기 리듬 기반 85개 특성을 추출하고, 하지불안증후군(RLS) 증상을 예측하는 머신러닝 모델을 개발했다. 웨어러블과 앱 데이터를 결합했을 때 AUC 0.86을 달성하여, 디지털 표현형 기반 RLS 객관적 예측의 가능성을 처음으로 대규모로 입증했다.
1. 이 연구는 왜 필요했을까
하지불안증후군(RLS)은 "다리를 움직이고 싶은 충동"이라는 주관적 증상이 핵심 진단 기준이다. 혈액 검사나 영상 검사로 확인할 수 있는 객관적 바이오마커가 없어, 진단이 전적으로 환자의 호소와 임상의의 판단에 의존한다. 이로 인해 진단 지연과 오진이 흔하다.
RLS 진단은 국제하지불안증후군연구그룹(IRLSSG)의 4가지 주관적 기준에 기반하며, 객관적 검사가 존재하지 않는다.
RLS는 야간에 증상이 악화되는 특징이 있어, 일주기 리듬(circadian rhythm)과 밀접한 관련이 있다. 이 연구는 웨어러블과 스마트폰으로 수집한 일주기 리듬 관련 디지털 데이터가 RLS를 객관적으로 예측할 수 있는지 탐색했다.
2. 어떻게 연구했을까
고려대학교에서 2023년 1월부터 2024년 7월까지 338명을 모집했다. 참여자는 불면증 환자 119명, 정상 수면자 89명 등 다양한 수면 상태를 포함했다. 각 참여자에게 4주간 웨어러블 기기를 착용하고 스마트폰 앱으로 자가 보고 데이터(수면 일기, 활동량, 기분 등)를 수집하도록 했다.
수집된 데이터에서 일주기 리듬 기반 85개 특성을 추출하고, Random Forest(RF)와 XGBoost(XGB) 등 앙상블 머신러닝 모델로 RLS 증상 유무와 중증도를 예측했다. IRLS(국제하지불안척도) 점수에 따라 비-RLS군(10 이하), RLS 증상군(10-20), 중증 RLS군(20 초과)으로 분류했다.
3. 무엇을 발견했을까
RLS 증상군 예측에서 웨어러블 데이터 단독으로 AUC 0.78을 달성했고, 웨어러블과 앱 데이터를 결합하면 AUC 0.86까지 향상되었다. 결합 모델의 정밀도는 0.68, 재현율은 1.00(RLS 증상군을 한 명도 놓치지 않음), F1 스코어는 0.81이었다.
웨어러블+앱 결합 모델은 RLS 증상군 예측에서 AUC 0.86, 재현율 1.00을 달성하여, RLS 증상이 있는 환자를 빠짐없이 감지할 수 있었다.
중증 RLS군 예측은 상대적으로 어려웠다. 웨어러블 단독 AUC 0.66, 결합 AUC 0.70으로, 증상 유무 판별보다 중증도 구분이 더 도전적인 과제임을 보여주었다. RF 모델은 RLS 증상군에서, XGB 모델은 중증군에서 각각 최고 성능을 보였다.
4. 우리 서비스에 어떻게 쓸까
제품 기능
FastingWorks 앱에서 수면의 질 저하를 호소하는 사용자에게, 웨어러블 데이터의 야간 활동 패턴과 일주기 리듬 분석을 통해 RLS 가능성을 선별하는 기능을 검토할 수 있다. 특히 자가 보고 수면 일기와 웨어러블 데이터의 결합이 단독 데이터보다 효과적이라는 결과는, 앱의 수면 일기 기능과 웨어러블 연동의 시너지를 뒷받침한다.
콘텐츠 활용
- "밤에 다리가 불편하다면: 하지불안증후군의 디지털 선별"
- "수면 장애의 숨은 원인, 웨어러블로 감지할 수 있을까?"
- "일주기 리듬이 말해주는 수면 건강의 신호들"
적용 시 주의사항
코호트 연구이지만 338명으로 비교적 소규모이며 한국인 집단 한정이므로, "초기 연구에서 디지털 데이터가 하지불안증후군 예측에 도움이 될 가능성이 제시되었습니다"라는 표현이 적절하다. RLS는 임상 진단이 필수이므로, 앱에서 진단을 시사하는 표현은 절대 사용해서는 안 된다.
5. 한계점
338명의 한국인 집단으로 연구가 한정되어, 다인종 대규모 전향적 검증이 필요하다. RLS 진단 자체가 주관적 기준에 기반하므로, 금본위 기준의 불확실성이 모델 평가에도 영향을 미친다.
중증 RLS군 예측 성능(AUC 0.70)은 실용적 활용에 다소 부족한 수준이다. 또한 4주간의 데이터 수집 기간이 필요한데, 사용자 순응도와 데이터 결측 문제가 실제 앱 환경에서 도전 요인이 될 수 있다.
마무리
이 연구는 디지털 표현형 기반 RLS 객관적 예측의 최초 대규모 시도로, 웨어러블과 스마트폰 데이터의 결합이 주관적 진단 기준에 의존하는 RLS의 객관적 선별에 유망한 접근임을 보여주었다. 일주기 리듬 분석이라는 생리적으로 타당한 프레임워크가 강점이다.
관련 문서
- 아이디어 파일: 하지불안증후군 감지