왜 G1-G4 만으로 부족한가
Schema / Range / Grounding / Consistency 4 게이트는 구조적 결함만 잡습니다. 그러나 LLM 의 출력은 통과하더라도 다음 3 가지 편향이 자주 섞여 있습니다.
- Confirmation. 가설을 뒷받침하는 근거만 인용
- Recency. 가장 최근 입력에 점수가 과대 반영
- Anchoring. 첫 평가 (e.g. 직전 analyst) 가 다음 evaluator 를 끌고 감
탐지 + 차단
BiasBuster 는 verdict 의 evidence 분포, 시점, 직전 verdict 와의 상관을 분석하여 위 3 가지 편향의 fingerprint 를 찾습니다. 검출 시 cause classification (Decision Tree 의 6 cause 중 하나) 를 부여하고, evaluator 에 re-prompt 또는 abstain 을 강제.
관련 코드
core/verification/. guardrails + cross_llm + stats.claude/skills/geode-verification. G1-G4 + BiasBuster + Cross-LLM + Cause Tree 의 통합 가이드
Clean Context
BiasBuster 의 anchoring 차단은 Clean Context anchoring prevention 과 연계됩니다. 각 evaluator 는 직전 단계의 verdict 를 직접 보지 못하고, evidence pool 만 받습니다. 자세한 패턴은 `.claude/skills/geode-analysis`.
참조: `core/verification/cross_llm.py`, `core/verification/stats.py`, `.claude/skills/geode-verification`.