웨어러블 파운데이션 모델 경쟁

Apple과 Google이 각자 손목 데이터로부터 거대 self-supervised 모델을 만들고 있다. 두 회사가 발표한 개별 알림 기능들은 빙산의 일각이며, 진짜 게임은 누가 먼저 "신체 신호의 GPT"를 만드느냐의 경쟁이다. 이 흐름이 3rd party 개발자에게 무엇을 의미하는지 정리한다.

두 진영의 모델 카탈로그

2023년부터 2025년 사이 Apple과 Google이 공개한 wearable 파운데이션 모델은 다음과 같다. 데이터 규모와 모달리티의 차이가 두 회사의 전략 차이를 그대로 드러낸다.

Apple 진영

Apple은 Apple Heart and Movement Study(AHMS)라는 자체 연구 플랫폼을 통해 약 16만 명에서 17만 명 규모의 라벨 없는 데이터를 다년간 축적해 왔고, 이 위에서 일련의 파운데이션 모델 라인업을 발표했다.

먼저 PPG와 ECG에 대한 기초 모델이다. 2023년 NeurIPS에 발표된 Large-scale Training of Foundation Models for Wearable Biosignals는 약 14만 1천 명, 3년치 PPG와 ECG를 사용하여 self-supervised contrastive learning으로 신호 표현을 학습했다. 이는 소비자 디바이스에서 수집한 데이터로 임상급 PPG/ECG 파운데이션 모델을 학습한 첫 사례이다.

다음은 가속도계 모델이다. Apple은 PPG 인코더의 표현 지식을 가속도계 인코더로 distillation 하는 접근을 취하여, 약 17만 2천 명, 2,000만 분의 가속도계 데이터로 별도 모델을 만들었다. 가속도계는 심박 센서가 잡지 못하는 미세한 움직임과 자세 변화를 잡으므로, PPG와 상호 보완적이다.

세 번째는 RelCon이라는 motion 파운데이션 모델로, 상대적 contrastive learning을 사용하여 같은 사용자의 다른 시간대 동작과 다른 사용자의 동작을 구분하는 표현을 학습한다. 이는 활동 패턴 자체의 representation에 특화되어 있다.

가장 결정적인 모델은 2025년 7월에 발표된 Wearable Behavior Model(WBM)이다. 이 모델은 약 16만 2천 명의 Apple Watch 사용자로부터 수집한 약 25억 시간의 행동 데이터를 학습 데이터로 사용한다. 27개 행동 메트릭(활동 에너지, 걸음 속도, HRV, 호흡률, 수면 시간 등)을 Mamba-2 아키텍처로 학습하여, 57개 건강 관련 다운스트림 작업에서 평가했다고 보고한다. 임신 92%, 당뇨 82%, 감염 76% 정확도라는 수치가 함께 보고되었다.

WBM이 결정적인 이유는 두 가지이다. 첫째, 데이터 규모가 25억 시간이라는 것은 단일 회사가 운영하는 wearable 모델 가운데 가장 크다. 둘째, 57개 작업을 단일 모델로 평가했다는 것은 Apple이 내부적으로 57개의 잠재적 알림 기능을 들고 있다는 의미이다. 향후 출시될 Apple Watch의 새 알림 기능은 사실상 WBM head를 추가하는 형태가 될 가능성이 매우 높다.

Google 진영

Google은 Apple보다 늦게 시작했지만 Pixel Watch와 Fitbit을 통합한 후 빠르게 따라오고 있다. 결정적인 모델은 2025년 7월에 발표된 SensorLM이다. 이 모델은 약 5,970만 시간의 Fitbit과 Pixel Watch 데이터를 사용하며, 127개국 약 10만 3천 명에서 수집되었다. 학습 기간은 2024년 3월부터 5월까지로 비교적 짧은 윈도우이다.

SensorLM의 디자인 특징은 멀티모달이라는 점이다. contrastive learning으로 센서 데이터와 자연어 caption을 페어링하고, 동시에 generative head로 caption을 생성하는 두 갈래 구조이다. 결과 모델은 zero-shot과 few-shot human activity recognition, cross-modal retrieval, caption generation을 모두 수행한다.

이 디자인은 Apple WBM과 결이 다르다. Apple은 행동 representation 자체에 집중하여 수많은 임상 작업의 backbone으로 쓸 의도이고, Google은 자연어 인터페이스를 처음부터 통합하여 LLM 에이전트와 직접 결합되는 형태를 노린다. WEAR-ME 인슐린 저항성 논문에서 LLM 에이전트가 함께 등장하는 것은 이 방향의 구체적 발현이다.

학계와 오픈소스

두 거대 회사 외에도 학계 진영이 의미 있게 움직이고 있다. 2025년 2월 발표된 Pulse-PPG는 오픈소스로 공개된 field-trained PPG 파운데이션 모델로, 실험실 환경뿐 아니라 실제 사용 환경에서도 generalize 되도록 학습되었다. UK Biobank의 wearable substudy도 학술 연구자에게 데이터셋을 제공하여 비교 가능한 backbone 모델 학습을 가능하게 한다.

이 학계 흐름이 중요한 이유는, 거대 회사가 영원히 backbone을 독점할 수는 없다는 신호이기 때문이다. 5년 정도의 시차를 두고 오픈소스 backbone이 거대 회사 모델의 70~80% 성능을 따라잡는 패턴이 NLP에서도 일어났고, wearable에서도 동일한 흐름이 시작되고 있다.

왜 이 경쟁이 모든 것을 바꾸는가

단일 backbone의 다중 head 효과

전통적으로 새 질환을 검출하는 알고리즘을 만들려면 그 질환에 특화된 데이터셋과 학습 파이프라인이 필요했다. 고혈압이면 BP cuff 라벨 데이터, 인슐린 저항성이면 HOMA-IR 라벨 데이터, 수면 무호흡이면 PSG 라벨 데이터를 별도로 모아야 했다.

파운데이션 모델 시대에는 이 비용 구조가 바뀐다. 한 번 학습된 backbone 위에 작은 head만 갈아 끼우면 새 질환을 추가할 수 있다. Apple이 WBM 위에서 57개 작업을 평가했다는 것은 정확히 이 전략의 실현이다. 이 효과로 인해 새 알림 기능의 출시 주기가 짧아지고, 같은 디바이스가 시간이 흐를수록 더 많은 질환을 다룬다.

분기에 한 번 새 알림이 나오는 미래

이 흐름을 외삽하면, Apple Watch와 Pixel Watch는 매 분기 또는 매 반기마다 새 알림 기능을 추가하는 시대로 진입한다. 이미 2024년 9월 수면 무호흡 알림, 2025년 9월 고혈압 알림이라는 1년 단위 주기가 형성되었고, WBM이 평가한 57개 작업 가운데 임상적으로 중요한 후보들(prediabetes, 갑상선, 임신 합병증, 우울증 선별 등)이 향후 출시 후보로 정렬되어 있다.

이는 wearable 자체의 가치가 시간이 흐를수록 증가한다는 의미이며, 동시에 새 디바이스를 사야 할 이유를 만들어 Apple과 Google의 하드웨어 매출도 강화한다.

파운데이션 모델은 출시되지 않는다

중요한 점은 Apple도 Google도 자기 파운데이션 모델 자체를 외부에 공개할 의사가 없어 보인다는 것이다. WBM의 embedding을 외부 개발자가 호출할 수 있는 API는 존재하지 않으며, HealthKit과 Google Health Connect는 derived feature(RHR, 수면 단계 등)만 노출한다. 이는 두 회사가 backbone 자체를 영구적인 moat로 삼겠다는 의도이다.

3rd party 개발자에게 이는 두 가지 의미를 갖는다. 첫째, 우리는 backbone에서 이길 수 없다. 둘째, 거대 회사가 노출하는 derived feature 자체가 이미 그들의 backbone에서 압축된 representation이며, 이 위에서 작은 head를 만드는 것이 우리가 할 수 있는 영역이다.

3rd party가 할 수 없는 것과 할 수 있는 것

할 수 없는 것

먼저 자체 파운데이션 모델 학습은 불가능하다. 1만 명 규모도 어렵고, 14만 명 규모는 불가능하다. 자체 SSL backbone을 만들어 Apple/Google과 경쟁하려는 시도는 자원의 비대칭으로 인해 거의 확실히 실패한다.

다음으로 raw PPG와 가속도계 신호 접근도 어렵다. HealthKit은 PPG raw waveform을 외부 앱에 노출하지 않으며, Apple Watch ECG 앱이 사용자의 명시적 trigger 시에만 단편적으로 raw signal을 제공한다. 따라서 raw signal 기반 새 알고리즘 개발 자체가 사실상 불가능하다.

세 번째로 single-watch 알림 기능 영역은 Apple과 Google이 흡수할 가능성이 매우 높다. "Apple Watch 데이터로 X 질환을 알려준다" 류의 단일 기능 앱은 2~3년 후 native 기능과 경쟁하게 될 것이다.

할 수 있는 것

먼저 derived feature 위의 supervised head는 우리가 만들 수 있다. Apple HealthKit이 노출하는 RHR, HRV SDNN, 수면 단계, 걸음 수, 운동 분 등은 그 자체로 풍부한 표현이며, 1,000명 규모 코호트만 있으면 새 작업의 head를 학습할 수 있다. Google WEAR-ME가 1,165명으로 0.80 AUROC을 달성한 것이 정확히 이 영역이다.

다음으로 다중 모달 융합은 우리가 더 잘할 수 있다. 거대 회사들은 자기 디바이스 데이터에 갇혀 있는 반면, 3rd party는 사용자가 입력한 건강검진 결과, 식이 기록, 약물 복용, 증상 일지 등 디바이스 외부 데이터를 함께 묶을 수 있다. 한국 사용자가 매년 받는 국가건강검진 결과를 결합하면, Apple과 Google이 미국에서 못 만드는 정확도를 한국에서 만들 수 있다.

세 번째로 인과 추론과 N=1 셀프 실험은 거대 회사가 절대 만들지 않는다. 알림 기능은 위험을 감지할 뿐, "왜 이 위험이 생겼는가"와 "무엇을 바꾸면 달라지는가"를 설명하지 않는다. 보수적 threshold와 규제 framing이 인과 클레임을 막기 때문이다. 이 공백은 구조적이며, 3rd party의 가장 안전한 영역이다.

네 번째로 알림 후 routing과 follow-through 영역은 거대 회사 입장에서 가치가 낮은 반면 사용자에게는 매우 중요하다. Apple HTN 알림을 받은 사용자가 BP cuff를 사고, 일지를 적고, 의사를 만나고, 약을 먹고, lifestyle을 바꾸는 일련의 흐름은 단일 디바이스 알림으로 끝나지 않는다. 이 흐름 전체를 묶는 앱은 거대 회사가 만들 동기가 약하다.

다섯 번째로 지역별 임상 통합이다. Apple과 Google은 미국 FDA와 EU MDR 기준의 글로벌 제품을 만들지만, 한국 식약처 SaMD 가이드라인이나 한국 의료보험 청구 코드와의 결합은 현지 사업자만 할 수 있다.

우리 전략의 결론

위 분석에서 자연스럽게 나오는 우리 전략은 다음과 같다.

첫째, 우리는 Apple과 Google의 backbone을 무료로 이용한다고 생각하라. HealthKit이 노출하는 derived feature 자체가 이미 Apple WBM의 압축된 representation이며, 우리가 그 위에 supervised head를 만드는 것은 사실상 그들의 backbone에 무임승차하는 것이다.

둘째, 단일 알림 기능에 의존하는 product positioning을 피하라. "Apple Watch로 X를 알려준다" 류의 앱은 2~3년 안에 native 기능과 경쟁하게 된다. 대신 다중 데이터 모달리티 결합, 인과 추론, routing과 follow-through 같은 영역에 자원을 집중하라.

셋째, 한국 시장의 임상 데이터 인프라를 leverage 하라. 매년 무료로 받는 건강검진 결과는 미국 wearable 회사가 가질 수 없는 한국 특화 자산이다. 사용자가 PDF 한 장을 사진으로 입력하면 fasting glucose와 HbA1c와 lipid panel이 모두 채워지고, 이 입력만으로도 wearable-only 모델 대비 0.10 AUROC 향상을 만들 수 있다.

넷째, 학계 오픈소스 backbone을 모니터링하라. Pulse-PPG처럼 공개되는 모델이 있으면 Apple/Google과 경쟁할 수는 없어도, 우리가 자체 학습할 수 없는 표현을 이용할 수 있는 길이 열린다. 5년 시차의 오픈소스 추격은 NLP가 보여준 패턴이고 wearable에서도 일어날 가능성이 있다.

다섯째, 파운데이션 모델 자체에 베팅하지 말라. 우리에게 합리적인 가정은 backbone은 영원히 거대 회사의 자산이라는 것이다. 우리가 만드는 가치는 head, fusion, causal explanation, routing이며, 이들은 model size로 결정되지 않고 product judgment로 결정된다.

한 줄 요약

Apple WBM과 Google SensorLM은 wearable의 GPT 자리를 두고 경쟁하는 두 후보이다. 우리는 그 자리에 들어갈 수 없지만, 그들이 노출하는 derived feature 위에서 만들 수 있는 head와 routing의 영역은 오히려 더 넓어졌다.

참고 문서

외부 출처

업데이트 이력

2026-05-08: 초안 작성. Apple WBM과 Google SensorLM, 학계 오픈소스 동향 정리 후 3rd party 전략 도출.