파일 목록으로

야간 HRV 측정, 어떤 웨어러블이 가장 정확할까?

기본 정보

  • 제목: Validation of nocturnal resting heart rate and heart rate variability in consumer wearables
  • 저자: Dial, M.B., Hollander, M.E., Vatne, E.A., Emerson, A.M., Edwards, N.A., & Hagen, J.A.
  • 저널: Physiological Reports
  • 출판연도: 2025
  • DOI: 10.14814/phy2.70527
  • 근거 수준: 검증 연구 (가정 기반 수면 모니터링)

5개 주요 소비자용 웨어러블 기기의 야간 HRV 및 안정 시 심박수 측정 정확도를 ECG 참조 기준과 비교 검증한 연구다. 536야간의 데이터를 분석한 결과, Oura Ring이 HRV와 심박수 모두에서 가장 높은 정확도를 보였으며(CCC 0.99), WHOOP는 중간 수준, Garmin과 Polar는 상대적으로 낮은 정확도를 나타냈다.


1. 이 연구는 왜 필요했을까

소비자용 웨어러블 기기의 HRV 측정 기능이 널리 보급되면서, 많은 사람들이 자신의 건강 상태를 수치로 확인하고 있다. 그러나 이 수치를 얼마나 신뢰할 수 있는지에 대해서는 의문이 남아 있었다. 기기별 정확도와 신뢰도에 대한 체계적인 비교 연구가 부족했기 때문이다.

특히 야간 수면 중 HRV 측정은 움직임이 적고 안정적이어서 가장 신뢰할 수 있는 측정 조건으로 간주된다. 그러나 이 환경에서의 기기별 정확도를 직접 비교한 연구는 드물었다. 이 연구는 5개 주요 웨어러블의 야간 HRV와 안정 시 심박수 정확도를 ECG 참조 기준(gold standard)과 비교하여, 기기별 특성과 한계를 파악하고자 했다.


2. 어떻게 연구했을까

13명의 건강한 성인(여성 6명, 남성 7명, 평균 연령 33.2세)이 참가했다. 핵심적인 설계 특징은 참가자의 실제 가정 환경에서 측정했다는 점이다. 실험실이 아닌 실제 수면 환경에서의 데이터이므로 생태학적 타당도가 높다. 총 536야간의 데이터가 수집되었다.

참조 기기(gold standard)로는 Polar H10 ECG 흉부 스트랩을 사용하고 Kubios HRV 소프트웨어로 데이터를 처리했다. 테스트 대상 웨어러블은 다섯 종류다. Oura Generation 4(스마트링), Oura Generation 3(스마트링), WHOOP 4.0(손목밴드), Garmin Fenix 6(스마트워치), Polar Grit X Pro(스마트워치)로, 모두 PPG 방식으로 야간에 연속 측정한다.

통계 분석에는 CCC(Lin's Concordance Correlation Coefficient, 일치상관계수)와 MAPE(Mean Absolute Percentage Error, 평균절대백분율오차)를 사용했다. CCC는 0.99-1.00이면 거의 완벽한 일치, 0.95-0.99이면 상당히 높은 일치, 0.90-0.95이면 중간 수준, 0.90 미만이면 낮은 일치로 해석한다.


3. 무엇을 발견했을까

Oura Ring이 압도적으로 정확했다

"Oura 기기는 두 지표 모두에서 ECG 참조 기준과 '거의 완벽한(near-perfect)' 일치도를 보였다."

HRV(RMSSD) 측정에서 Oura Gen 4는 CCC 0.99, MAPE 5.96%로 가장 높은 정확도를 기록했다. Oura Gen 3도 CCC 0.97, MAPE 7.15%로 매우 높은 수준이었다. 안정 시 심박수에서도 Oura Gen 4가 CCC 0.98(MAPE 1.94%), Gen 3이 CCC 0.97(MAPE 1.67%)로 최상위였다. 야간 전체에 걸쳐 5분 샘플로 세그먼트화하여 밤새 평균을 내는 알고리즘이 안정적인 결과를 만들어낸 것으로 보인다.

WHOOP는 허용 가능한 중간 수준이었다

WHOOP 4.0은 HRV에서 CCC 0.94, MAPE 8.17%로 중간에서 높은 수준의 정확도를 보였다. 52Hz 고빈도로 연속 측정하며 깊은 수면과 마지막 수면 단계 위주로 HRV를 계산하는 "동적 평균(dynamic average)" 방식을 사용한다. 다만 MAPE의 표준편차가 10.49%로 높아, 개인 간 변동성이 상당히 크다는 점이 한계다.

Garmin과 Polar는 정확도가 낮았다

"WHOOP는 허용 가능한 중간 수준의 정확도를 보인 반면, Garmin과 Polar는 HRV 측정에서 눈에 띄게 낮은 일치도를 나타내 제조사 간 알고리즘 신뢰도의 차이를 시사한다."

Garmin Fenix 6은 HRV CCC 0.87, MAPE 10.52%로 낮은 일치도를 보였으며, RHR 분석에서는 데이터 품질 문제로 아예 제외될 정도였다. Polar Grit X Pro는 HRV CCC 0.82, MAPE 16.32%로 가장 낮은 정확도를 기록했다. 특히 Polar의 표준편차는 24.39%로, 측정 간 변동성이 매우 심했다.

같은 밤, 같은 사람이어도 기기마다 값이 다르다

각 기기의 HRV 계산 알고리즘이 다르기 때문에 이런 차이가 발생한다. Oura는 밤새 5분 샘플의 전체 야간 평균을 사용하고, WHOOP는 깊은 수면과 마지막 단계 위주의 동적 평균을 사용한다. Garmin과 Polar는 독자적이고 비공개인 알고리즘을 사용한다. WHOOP 방식은 깊은 수면 위주이므로 일반적으로 더 높은 HRV 값을, Oura 방식은 전체 야간 평균이므로 상대적으로 낮은 값을 산출하는 경향이 있다.


4. 우리 서비스에 어떻게 쓸까

제품 기능

이 연구 결과를 바탕으로 연동 기기별로 차별화된 사용자 경험을 설계할 수 있다. Oura 사용자에게는 상세한 일일 HRV 분석과 수치 기반 피드백을 제공하는 것이 합리적이다. CCC 0.97 이상의 높은 정확도가 검증되었기 때문이다.

WHOOP 사용자에게는 단일 측정값보다 7일 이동평균 중심으로 표시하고, 추세 기반 피드백에 집중하는 것이 적절하다. Garmin이나 Polar 사용자에게는 월간 추세만 표시하고, 구체적 수치보다 방향성(상승/하락)을 강조하는 것이 바람직하다.

기기 변경 시에는 명확한 안내가 필요하다. 각 기기의 측정 방식이 다르므로 이전 데이터와 직접 비교가 어려우며, 새 기기로 7-14일간 새로운 기준선을 설정해야 한다는 점을 사용자에게 알려야 한다.

콘텐츠 활용

  • "2025년 웨어러블 HRV 측정, 어떤 기기가 가장 정확할까? (연구 기반 비교)"
  • "Oura vs WHOOP: HRV 측정 정확도 과학적 비교"
  • "왜 기기마다 HRV가 다르게 나올까?"

적용 시 주의사항

이 연구의 표본은 13명으로 소규모이며, 심혈관 질환이 없는 건강한 성인(평균 33.2세)만을 대상으로 했다. 따라서 질환자, 고령자, 또는 다른 기기 모델에 이 결과를 직접 일반화하기는 어렵다. 또한 웨어러블 기기의 소프트웨어는 지속적으로 업데이트되므로, 시간이 지나면 정확도 결과가 달라질 수 있다. 앱에서 기기별 정확도 등급을 표시할 때는 "특정 연구 기반의 참고 정보"임을 명시해야 한다.


5. 한계점

가장 큰 한계는 소규모 표본(13명)이다. 통계적으로 536야간의 데이터가 수집되었지만, 참가자 수가 적어 개인차를 충분히 반영하지 못할 수 있다. 건강한 성인만을 대상으로 했기 때문에, 만성 질환자나 고령자에서의 정확도는 별도로 검증해야 한다.

특정 기기 모델만 테스트되었으므로, 같은 브랜드의 다른 모델에 결과를 적용하기 어렵다. 기기 펌웨어와 알고리즘이 업데이트되면 결과가 달라질 수 있다는 점도 유의해야 한다. 그러나 실제 가정 환경에서 여러 기기를 동시에 비교했다는 점에서 생태학적 타당도가 높고, ECG 참조 기준을 사용한 검증이라는 점에서 2025년 현재 가장 실용적인 기기 비교 데이터라 할 수 있다.


마무리

이 연구는 야간 HRV 측정에서 Oura Ring이 ECG와 거의 완벽한 일치도(CCC 0.99)를 보이며 가장 정확하고, WHOOP는 중간 수준, Garmin과 Polar는 상대적으로 낮은 정확도를 보인다는 것을 실제 가정 환경에서 검증했다. 제품 설계 시 기기별로 차별화된 데이터 표시 전략을 수립하고, 기기 간 절대값 비교의 한계를 사용자에게 명확히 안내하는 것이 핵심이다.


관련 문서

0 / 46