Activity-Glycemia Benchmark Config
목적
이 문서는 activity 강화 추론식의 회귀 방지 기준을 정의한다. 구현 변경 시 동일한 시나리오를 재실행해 정확도 저하를 빠르게 감지한다.
기본 원칙
- 정확도 우선: 활동 개입 효과가 점수에 안정적으로 반영되어야 한다.
- 보수적 업데이트: demographic 보정은 baseline 이동만 허용하고 방향성을 뒤집지 않는다.
- 설명 일치성: 디버그 출력은 실제 계산식과 1:1로 대응해야 한다.
시나리오 세트
| ID | 시나리오 | 입력 조건 | 기대 결과 |
|---|---|---|---|
| G-INT-10 | Post-meal walking intervention | 동일 식사/HRV/HR에서 sedentary vs post-meal walking | GlucoseResponse가 intervention에서 baseline 대비 최소 10% 낮아야 함 |
| G-SUB-01 | Demographic subgroup robustness | 연령/성별/BMI 조합 4개 이상, 동일 활동 개입 | 모든 subgroup에서 intervention 점수가 baseline보다 낮아야 함 |
| DBG-01 | Formula trace parity | activity + demographic 입력 포함 | debug report에 activityCoverage, demographicAdjustment/Offset, demographicBonus가 표시되어야 함 |
릴리즈 게이트
G-INT-10: pass 필수G-SUB-01: pass 필수DBG-01: pass 필수
하나라도 실패하면 가중치/피처 변경을 릴리즈하지 않는다.
테스트 실행
Inference 패키지에서 아래 테스트를 실행한다.
cd ios/Packages/Inference swift test
향후 확장
- CGM 리플레이 데이터가 확보되면 meal-level MAE/RMSE gate 추가
- time-of-day(아침/점심/저녁) 계층별 gate 분리
- 사용자별 rolling calibration 적용 시 calibration error gate 추가