100만 명의 건강 데이터를 모으면 정밀의학의 미래가 열릴까?
기본 정보
- 제목: NIH All of Us Research Program: Fitbit Physical Activity and Sleep Data
- 저자: NIH All of Us Research Program
- 저널: NEJM (프로그램 소개), Medicine & Science in Sports & Exercise (Fitbit 데이터 분석)
- 출판연도: 2018년 시작, 2025년 v8 데이터 릴리스
- DOI: 다수
- 근거 수준: 정부 주도 대규모 코호트 (633,000명 이상 등록)
- URL: allofus.nih.gov
NIH All of Us는 100만 명 이상 등록을 목표로 하는 미국 최대 바이오메디컬 데이터셋이다. 전자건강기록, 설문, 바이오샘플(게노믹 데이터), Fitbit 등 웨어러블 기기 데이터를 통합하며, 2025년 v8 릴리스에서 59,000명 이상의 Fitbit 종단 데이터가 포함되었다. 기존 연구 데이터셋의 인구통계적 편향을 해결하기 위해 다양한 배경의 참여자를 의도적으로 모집한다.
1. 이 연구는 왜 필요했을까
기존의 대규모 바이오뱅크(UK Biobank, Million Veteran Program 등)는 특정 인구통계(주로 백인, 중산층)에 편향되어, 연구 결과의 일반화 가능성에 한계가 있었다. 또한 웨어러블 데이터를 체계적으로 통합하는 대규모 연구 인프라가 부족했다.
All of Us는 정밀의학을 가속화하기 위해, 라이프스타일과 환경이 질병 치료 및 예방에 미치는 영향을 이해하고, 점점 더 개인화된 의료 실천으로 이어지는 것을 목표로 한다.
2015년 오바마 대통령의 국정연설에서 처음 발표된 이 프로그램은, 유전체학, 전자건강기록, 설문, 웨어러블 데이터를 하나의 플랫폼에서 통합하여 연구자에게 제공하는 전례 없는 규모의 시도다.
2. 어떻게 연구했을까
All of Us는 전자건강기록, 설문, 신체 측정, 바이오샘플(유전체 데이터), 웨어러블 디지털 건강 기술(DHT) 데이터 등 다중 소스에서 데이터를 수집한다. Fitbit 통합은 두 가지 경로로 이루어진다. BYOD(Bring Your Own Device) 프로그램은 2020년 12월부터 참여자가 자신의 Fitbit을 연결할 수 있게 했으며, WEAR 이니셔티브는 연구용 Fitbit을 제공하여 대표성을 높였다.
2025년 2월 v8 데이터 릴리스에서 Fitbit 코호트는 30,445명으로, 참여 15~21일차 기준 160,487 person-days의 활동 및 수면 데이터를 포함한다. 참여자의 99%가 신체 활동과 수면 데이터 모두를 제공했으며, 착용일 평균 착용 시간은 21시간 50분에 달했다.
3. 무엇을 발견했을까
v8 릴리스 기준 633,000명 이상이 등록되어 있으며, 59,000명 이상이 심층 Fitbit 종단 데이터를 제공한다. BYOD 참여자 57%와 WEAR 참여자 43%로 구성되어, 자발적 참여자와 연구 목적 참여자의 데이터를 모두 포함한다.
All of Us의 Fitbit 데이터는 신체 활동과 수면을 함께 탐구할 수 있는 독특한 기회를 제공하며, 이 두 건강 행동은 공유된 생리학적 및 행동적 경로를 통해 질병 위험에 영향을 미친다.
비히스패닉 백인 66%, 여성 68%로 아직 인구통계적 다양성이 완전하지 않지만, 기존 바이오뱅크보다는 더 다양한 인구를 포함하고 있다. 유전체 데이터와 웨어러블 데이터의 결합은 유전적 소인과 생활 습관의 상호작용을 연구할 수 있는 유일한 자원이다.
4. 우리 서비스에 어떻게 쓸까
제품 기능
All of Us의 연구 결과를 근거로, 인구 수준의 건강 기준치와 개인 데이터를 비교하는 "나의 건강 위치" 기능을 구현할 수 있다. 예를 들어 "당신의 일일 걸음수는 같은 연령대 상위 30%에 해당합니다"와 같은 맥락적 인사이트를 제공할 수 있다.
콘텐츠 활용
- "100만 명의 건강 데이터가 만드는 정밀의학의 미래"
- "웨어러블 데이터와 유전체의 결합: All of Us가 여는 새로운 지평"
적용 시 주의사항
Researcher Workbench를 통한 데이터 접근에는 엄격한 자격 요건이 있으며, 상업적 활용에 대한 정책을 확인해야 한다. "대규모 인구 연구에서 활동량과 건강 지표 사이의 연관성이 관찰되었습니다" 수준의 표현이 적절하다.
5. 한계점
아직 100만 명 목표의 약 63%인 633,000명이 등록되어 있으며, Fitbit 데이터를 제공하는 참여자는 59,000명으로 전체의 일부에 불과하다. 비히스패닉 백인과 여성이 과대 대표되어, 인구통계적 다양성 목표를 완전히 달성하지 못했다.
Fitbit이라는 특정 브랜드에 의존하므로, 다른 웨어러블 기기 사용자의 데이터는 포함되지 않는다. 종단 데이터의 축적은 시간이 더 필요하며, 참여자 탈락과 기기 교체로 인한 데이터 공백도 고려해야 한다.
마무리
NIH All of Us는 정부 주도의 대규모 오픈 헬스 데이터 생태계로, 웨어러블 데이터와 유전체를 통합한 인구 수준 연구 인프라를 제공한다. 인구통계적 다양성과 데이터 다중 소스 통합이라는 두 가지 핵심 강점은, 정밀의학 연구의 기반으로서 독보적인 가치를 가진다.
관련 문서
- 아이디어 파일: 오픈 데이터셋/벤치마크 생태계