왜 사이드카인가
에이전트(L4)는 실행합니다. 런타임(L2)은 인프라를 제공합니다. Automation은 두 계층 사이에서 결과를 관찰하고 그 아래 런타임을 회전시키는 사이드카입니다. 더 나은 모델을 승격시키고, drift된 모델을 deprecate하고, 전문가 피드백을 수집합니다. 4-계층 스택 자체에는 포함되지 않습니다.
파일
core/automation/model_registry.py:36.class PromotionStage(development, staging, production).core/automation/feedback_loop.py. phase FSM.core/automation/drift_detector.py. correlation 및 severity 분석.core/automation/expert_panel.py. junior/senior/principal 투표 티어.core/automation/outcome_tracking.py. 모델 출력 결과의 long-tail 결과 추적.core/automation/correlation.py. 결과 vs 메트릭 상관관계 분석.core/automation/snapshot.py. 모델 stage별 스냅샷 (rollback 용).
7 모듈 구성
| 모듈 | 책임 | 핵심 클래스 / 함수 |
|---|---|---|
model_registry.py | 모델 stage 관리 | PromotionStage enum |
feedback_loop.py | 피드백 phase FSM | FeedbackPhase 4 상태 |
drift.py | drift 감지 | severity 4-tier 분류 |
correlation.py | 출력↔메트릭 상관 | p-value gate |
expert_panel.py | 가중 투표 | 3-tier (junior/senior/principal) |
outcome_tracking.py | 장기 결과 기록 | append-only ledger |
snapshot.py | rollback 스냅샷 | per-stage immutable copy |
프로모션 단계
development → staging → production ↑ ↑ │ │ │ ▼ └──────────────┴──── drift detected → rollback
drift 감지
drift 심각도는 low / medium / high / critical로 등급화됩니다. production 모델의 critical drift는 즉시 이전 staging 스냅샷으로 롤백을 트리거합니다. 더 낮은 심각도는 메트릭으로 기록되고 전문가 패널을 기다립니다.
전문가 패널 투표
모델 출력에 이의가 제기되면 가상 전문가 패널 (junior, senior, principal 티어)이 출력 수용 여부에 투표합니다. 표는 티어로 가중치가 매겨지고 결과는 모델 레지스트리로 피드백됩니다.
발화되는 훅 이벤트
DRIFT_DETECTEDMODEL_PROMOTEDOUTCOME_COLLECTEDEXPERT_VOTE_CASTFEEDBACK_PHASE_CHANGED