파일 목록으로

Activity-Glycemia Benchmark Config

목적

이 문서는 activity 강화 추론식의 회귀 방지 기준을 정의한다. 구현 변경 시 동일한 시나리오를 재실행해 정확도 저하를 빠르게 감지한다.

기본 원칙

  1. 정확도 우선: 활동 개입 효과가 점수에 안정적으로 반영되어야 한다.
  2. 보수적 업데이트: demographic 보정은 baseline 이동만 허용하고 방향성을 뒤집지 않는다.
  3. 설명 일치성: 디버그 출력은 실제 계산식과 1:1로 대응해야 한다.

시나리오 세트

ID시나리오입력 조건기대 결과
G-INT-10Post-meal walking intervention동일 식사/HRV/HR에서 sedentary vs post-meal walkingGlucoseResponse가 intervention에서 baseline 대비 최소 10% 낮아야 함
G-SUB-01Demographic subgroup robustness연령/성별/BMI 조합 4개 이상, 동일 활동 개입모든 subgroup에서 intervention 점수가 baseline보다 낮아야 함
DBG-01Formula trace parityactivity + demographic 입력 포함debug report에 activityCoverage, demographicAdjustment/Offset, demographicBonus가 표시되어야 함

릴리즈 게이트

  1. G-INT-10: pass 필수
  2. G-SUB-01: pass 필수
  3. DBG-01: pass 필수

하나라도 실패하면 가중치/피처 변경을 릴리즈하지 않는다.

테스트 실행

Inference 패키지에서 아래 테스트를 실행한다.

cd ios/Packages/Inference
swift test

향후 확장

  1. CGM 리플레이 데이터가 확보되면 meal-level MAE/RMSE gate 추가
  2. time-of-day(아침/점심/저녁) 계층별 gate 분리
  3. 사용자별 rolling calibration 적용 시 calibration error gate 추가

0 / 20