파일 목록으로

웨어러블 데이터와 ML로 인지 검사 결과를 예측할 수 있을까?

기본 정보

  • 제목: Predicting poor performance on cognitive tests among older adults using wearable device data and machine learning: a feasibility study
  • 저자: Collin Sakal, Tingyou Li, Juan Li, Xinyue Li
  • 저널: npj Aging
  • 출판연도: 2024
  • DOI: 10.1038/s41514-024-00177-x
  • PMID: 39587119
  • 근거 수준: 코호트 연구

NHANES(2011~2014년) 참가자 2,479명의 손목 착용 가속도계 9일간 데이터를 분석하여, 인지 검사 저조 수행을 ML로 예측한 실현가능성 연구다. CatBoost 모델이 처리 속도/작업 기억/주의력 예측에서 중앙 AUC 0.84를 달성했다. 수면 효율 변동성이 인지 기능의 유의한 예측인자임을 확인했다.


1. 이 연구는 왜 필요했을까

인지 기능 저하의 조기 감지는 신경심리검사에 의존하지만, 이는 전문가가 수행해야 하고 비용과 시간이 소요된다. 일상에서 착용하는 웨어러블 기기의 데이터만으로 인지 기능 수준을 추정할 수 있다면, 대규모 인구에서의 인지 건강 스크리닝이 가능해진다.

손목 착용 기기의 활동, 수면, 일주기 리듬, 광 노출 데이터로 인지 기능을 예측할 수 있는지 검증하는 것이 이 연구의 목표였다.

특히 2,479명이라는 대규모 국가 대표 코호트를 활용함으로써, 기존 소규모 연구의 외적 타당성 한계를 극복하고자 했다.


2. 어떻게 연구했을까

NHANES(2011~2014년)에 참여한 고령자 2,479명(평균 나이 69.6세)의 데이터를 분석했다. 참여자들은 손목 착용 가속도계를 9일간 착용했다. 가속도계 데이터에서 활동량, 수면(수면 효율, 수면 시간, 수면 변동성), 일주기 리듬, 주변 광 노출 관련 피처를 추출했다.

3가지 인지 검사로 서로 다른 인지 영역을 평가했다. DSST(숫자-기호 치환 검사)는 처리 속도/작업 기억/주의력을, CERAD-WL(단어 학습)은 기억력을, AFT(동물 유창성 검사)는 언어 유창성을 평가한다. CatBoost, XGBoost, Random Forest 모델을 10-fold 교차검증(20회 반복)으로 학습하고 평가했다.


3. 무엇을 발견했을까

CatBoost 모델이 처리 속도/작업 기억/주의력 예측(DSST)에서 중앙 AUC 0.84로 가장 우수한 성능을 보였다. 기억력(CERAD-WL) 예측은 AUC 0.73, 언어 유창성(AFT) 예측은 AUC 0.71로 인지 영역에 따라 성능 차이가 있었다.

낮은 활동 변동성, 중등도-고강도 활동 감소, 높은 수면 효율 변동성이 인지 기능 저하의 유의한 예측인자로 확인되었다.

연령과 교육 수준이 가장 강력한 예측 변수였으나, 활동과 수면 파라미터도 DSST 결과와 유의한 연관을 보였다. 처리 속도와 주의력이 다른 인지 영역보다 웨어러블 데이터로 더 잘 예측되는 것은, 이러한 기능이 일상 활동 패턴에 더 직접적으로 반영되기 때문으로 해석된다.


4. 우리 서비스에 어떻게 쓸까

제품 기능

FastingWorks 앱에서 Apple Watch의 활동량 변동성과 수면 효율 변동성을 장기적으로 추적하여, 인지 건강 관련 인사이트를 제공할 수 있다. 특히 수면 효율 변동성(매일 수면의 질이 일정한지 들쑥날쑥한지)이 인지 건강의 유의한 예측인자라는 점은, 수면 규칙성 추적 기능의 근거가 된다.

콘텐츠 활용

  • "2,479명의 데이터가 보여주는 것: 수면 규칙성과 인지 건강의 연결"
  • "활동 패턴의 변동성이 뇌 건강에 대해 말해주는 것"

적용 시 주의사항

2,479명 규모의 코호트 연구이므로 "활동 및 수면 패턴과 인지 기능 간에 관련이 있는 것으로 보인다" 수준의 표현이 적절하다. 인지 영역에 따라 예측 성능이 크게 달라지므로, 단일 "인지 건강 점수"보다는 영역별 인사이트가 더 정직한 접근이다.


5. 한계점

횡단 연구 설계이므로 웨어러블 데이터가 미래의 인지 저하를 예측하는지는 직접 검증되지 않았다. 연령과 교육 수준이 가장 강력한 예측 변수였으므로, 웨어러블 데이터 단독의 추가적 예측 가치는 제한적일 수 있다. 또한 2011~2014년 데이터이므로 최신 웨어러블 기기의 센서 정확도와 차이가 있을 수 있다. 앱에서 인지 건강 관련 기능을 제공할 때는 연령과 교육 수준을 고려한 개인화된 기저선 설정이 필요하다.


마무리

이 연구는 2,479명의 대규모 코호트에서 웨어러블 데이터와 ML로 인지 기능을 AUC 0.84로 예측할 수 있음을 보여주었다. 수면 효율 변동성이 인지 건강의 유의한 예측인자라는 발견은, 수면 규칙성 추적이 인지 건강 모니터링의 핵심 기능이 될 수 있음을 시사한다.


관련 문서

0 / 34