Foundation Model as a Service
웨어러블 행동 데이터의 foundation model을 API로 제공하여, 3rd party 개발자가 각자의 건강 태스크에 파인튜닝할 수 있는 플랫폼 비즈니스 모델
개요
- 핵심 개념: Apple의 WBM(Wearable Behavior Model)처럼, 대규모 웨어러블 데이터로 사전학습된 foundation model을 API로 제공. 제3자 개발자가 수면, 심혈관, 정신건강 등 각자의 건강 태스크에 파인튜닝하여 활용
- 현재 성숙도: 연구 단계에서 초기 상용화 단계로 전환 중. Apple, Google이 자사 데이터 기반 foundation model을 발표했으나, 외부 API 제공은 아직 제한적. Open Wearables 같은 오픈소스 시도가 등장
주요 연구 및 사례
1. Apple WBM (Wearable Behavior Model) (Apple ML Research, 2024)
- 출처: Apple Machine Learning Research
- 핵심 내용: Apple Heart and Movement Study(AHMS)의 162K 참여자로부터 수집한 25억 시간 이상의 웨어러블 데이터로 학습한 행동 기반 foundation model. 27개의 HealthKit 행동 지표(걸음수, 보행 안정성, VO2 max, HRV, 수면 등)를 활용
- 방법론/접근: Mamba-2 아키텍처 기반으로 주간 단위 데이터 블록을 처리. PPG 기반 모델과 결합한 하이브리드 접근 방식 사용
- 주요 결과/성과: 57개 건강 관련 태스크에서 평가. 임신 감지 92% 정확도, 동적 태스크(수면 품질, 호흡기 감염 등)에서 PPG 모델 대비 우수. 하이브리드 모델이 47개 결과 중 42개에서 최고 성능
- 의의: 최초의 대규모 웨어러블 행동 데이터 foundation model로, raw 센서 데이터가 아닌 해석 가능한 행동 지표로 학습하여 일반화 성능을 입증
2. Google SensorLM (Google Research, 2025)
- 출처: Google Research Blog
- 핵심 내용: Fitbit/Pixel Watch 사용자 103,000명 이상의 5,970만 시간 멀티모달 센서 데이터로 사전학습한 센서-언어 foundation model 패밀리. 센서 데이터와 자연어 설명을 연결
- 방법론/접근: 대조 학습(contrastive learning)으로 센서 신호와 텍스트를 정렬하고, 생성 모델로 자동 캡션 생성. Zero-shot 및 few-shot 활동 인식, 교차 모달 검색, 캡션 생성 지원
- 주요 결과/성과: 센서 데이터 이해에서 새로운 SOTA 달성. 자연어 질의를 통한 건강 데이터 상호작용 가능
- 의의: 센서 데이터를 자연어로 변환하는 최초의 대규모 모델로, 디지털 헬스 코치, 임상 모니터링 도구 등 차세대 건강 애플리케이션의 기반 기술
3. Google LSM-2 (Large Sensor Model) (Google Research, 2025)
- 출처: Google Research Blog
- 핵심 내용: 60,000명 이상의 참여자로부터 4,000만 시간의 웨어러블 데이터로 학습한 foundation model. 불완전한 데이터에서도 학습 가능한 AIM(Adaptive and Inherited Masking) 프레임워크 도입
- 방법론/접근: 자기지도학습 기반. 센서 고장이나 데이터 누락 시에도 성능 저하 최소화하는 로버스트한 학습 방식
- 주요 결과/성과: 센서 실패나 시간 윈도우 제거 시에도 데이터 보정(imputation) 기반 모델 대비 현저히 적은 성능 저하
- 의의: 현실 세계의 불완전한 웨어러블 데이터를 다루는 실용적 솔루션으로, 실제 배포에서 필수적인 내결함성(fault tolerance) 확보
4. PAT (Pretrained Actigraphy Transformer) (Dartmouth College, 2024)
- 출처: arXiv / PMC
- 핵심 내용: 29,307명의 미국 전국 표본 데이터로 사전학습한 최초의 오픈소스 웨어러블 운동 데이터 foundation model. 정신건강 예측 태스크에 특화
- 방법론/접근: 트랜스포머 기반 아키텍처에 패치 임베딩 등 새로운 기법 적용. 웨어러블 시계열 데이터의 순차적 특성을 언어 모델과 유사하게 처리
- 주요 결과/성과: 정신건강 예측 태스크에서 SOTA 달성
- 의의: 오픈소스로 공개된 최초의 웨어러블 foundation model로, 학술 연구 접근성 확대 및 3rd party 파인튜닝 모델의 가능성 입증
5. Open Wearables (Momentum, 2025)
- 출처: Momentum Blog
- 핵심 내용: 모든 앱, 코치, 건강 플랫폼이 데이터 기반 AI 기능을 즉시 활용할 수 있는 오픈소스 웨어러블 건강 데이터 API. 표준화된 개발자 친화적 인터페이스 제공
- 방법론/접근: 다양한 웨어러블 디바이스의 건강 데이터를 표준화하여 단일 API로 제공. GitHub에서 전체 소스코드 및 배포 가이드 공개
- 주요 결과/성과: 개인화 웰니스 앱, 임상 의사결정 지원 도구, AI 건강 코칭 플랫폼 등 다양한 활용 사례 지원
- 의의: Foundation Model as a Service의 데이터 접근 레이어로서의 가능성. 오픈소스 표준화가 생태계 성장의 핵심 인프라 역할
6. LLM 에이전트 기반 웨어러블 건강 인사이트 (Google/Nature Communications, 2025)
- 출처: Nature Communications
- 핵심 내용: 웨어러블 데이터를 해석하여 정확하고 개인화된 건강 인사이트를 제공하는 LLM 에이전트(PHIA). 다단계 추론과 코드 생성, 정보 검색을 결합
- 방법론/접근: 4,000개 이상의 건강 인사이트 질문으로 구성된 벤치마크 데이터셋 생성. 650시간의 인간 전문가 평가 수행
- 주요 결과/성과: 객관적 수치 질문 84% 정확도, 개방형 질문 83% 호의적 평가
- 의의: Foundation model을 활용한 API 서비스의 최종 사용자 인터페이스 형태를 보여주는 사례. 자연어 기반 건강 데이터 질의응답의 가능성 입증
산업 동향 및 주요 플레이어
| 기업/기관 | 모델/플랫폼 | 특징 |
|---|---|---|
| Apple | WBM | 162K 사용자, 25억 시간 데이터, Mamba-2 아키텍처 |
| SensorLM, LSM-2 | 103K 사용자, 5,970만 시간, 센서-언어 멀티모달 | |
| Dartmouth | PAT | 오픈소스, 29K 사용자, 정신건강 특화 |
| Momentum | Open Wearables | 오픈소스 API, 다기기 표준화 |
| BioStrap | Developer Portal | 의료 웨어러블 API, 실시간 스트리밍 |
| Human API | Health Data Platform | 의료 기록 + 웨어러블 통합 API |
| Koneksa | Digital Biomarker Platform | 임상시험 특화, 센서 불문 |
규제 및 윤리적 과제
- 데이터 프라이버시: 대규모 건강 데이터 수집과 모델 학습에 대한 동의 및 비식별화 문제. HIPAA, GDPR 등 규제 프레임워크 적용 범위가 웨어러블 데이터에 대해 불명확
- 모델 편향: 학습 데이터의 인구통계적 편향이 건강 예측 정확도에 미치는 영향. Apple WBM은 AHMS 참여자 기반으로 특정 인구통계에 편향 가능
- 의료기기 규제: Foundation model 기반 건강 예측이 의료기기(SaMD)에 해당하는지 여부. FDA의 AI/ML 기반 SaMD 규제 프레임워크와의 정합성
- 데이터 소유권: 웨어러블로 수집된 건강 데이터의 소유권과 API를 통한 제3자 접근 권한 문제
- 임상 검증: Foundation model의 건강 예측이 임상적으로 유효한지 검증하는 표준 부재