BiasBuster

왜 G1-G4 만으로 부족한가

Schema / Range / Grounding / Consistency 4 게이트는 구조적 결함만 잡습니다. 그러나 LLM 의 출력은 통과하더라도 다음 3 가지 편향이 자주 섞여 있습니다.

Confirmation. 가설을 뒷받침하는 근거만 인용
Recency. 가장 최근 입력에 점수가 과대 반영
Anchoring. 첫 평가 (e.g. 직전 analyst) 가 다음 evaluator 를 끌고 감

탐지 + 차단

BiasBuster 는 verdict 의 evidence 분포, 시점, 직전 verdict 와의 상관을 분석하여 위 3 가지 편향의 fingerprint 를 찾습니다. 검출 시 cause classification (Decision Tree 의 6 cause 중 하나) 를 부여하고, evaluator 에 re-prompt 또는 abstain 을 강제.

Clean Context

BiasBuster 의 anchoring 차단은 Clean Context anchoring prevention 과 연계됩니다. 각 evaluator 는 직전 단계의 verdict 를 직접 보지 못하고, evidence pool 만 받습니다. 자세한 패턴은 `.claude/skills/geode-analysis`.

참조: `core/verification/cross_llm.py`, `core/verification/stats.py`, `.claude/skills/geode-verification`.

왜 G1-G4 만으로 부족한가

탐지 + 차단

관련 코드

Clean Context