GEODE
스스로를 고쳐 쓰는 자율 에이전트 하네스.
GEODE는 비-파라메트릭 계열의 자기 진화 에이전트입니다. 모델 가중치는 절대 건드리지 않습니다. 대신 자기 자신을 둘러싼 스캐폴드, 즉 시스템 프롬프트와 도구 정책, 작업 분해와 반성 루프, 스킬 카탈로그를 직접 바꿔 나아집니다.
변화의 적합도는 능력 벤치마크가 아니라 적대적 안전 감사로 측정합니다. 핵심 안전 차원에는 하한선이 있어, 그 선을 넘어 후퇴하는 변화는 거부합니다.
에이전트 및 스캐폴드 시연
두 개의 루프
안쪽의 에이전트 루프는 하나의 작업을 실행합니다. 바깥쪽 루프는 작업을 실행하는 시스템 자체를 튜닝합니다. 안쪽 루프는 트랜스크립트와 결과를 남기고, 바깥쪽 루프는 그 기록을 읽어 다음번 안쪽 루프의 동작 방식을 바꿉니다.
self-evolving, 비-파라메트릭
GEODE는 자기 자신을 둘러싼 스캐폴딩을 바꾸면서 개선됩니다. 모델 가중치는 절대 건드리지 않습니다.
| 측면 | 값 |
|---|---|
| 바꾸는 것 | 스캐폴딩: 시스템 프롬프트, 도구 정책, 작업 분해, 리플렉션, 스킬 |
| 절대 안 바꾸는 것 | 모델 가중치 |
| 측정 방법 | 적대적 안전 감사 (Petri 등급) |
한 사이클의 모양입니다. 변형이 승격되면 다음 사이클의 기준선이 되고, 되돌려지면 같은 기준선에서 다시 시작합니다.
폐루프 보기 →적대적 감사로 측정
후보 변경은 모두 다차원 안전 루브릭으로 채점됩니다. 핵심 안전 차원은 하드 플로어 뒤에 있어서, 이 차원을 후퇴시키는 변경은 그 자리에서 거부됩니다. 변경은 노이즈 수준을 넘어서는 실제 이득이 있을 때만 승격되고, 그렇지 않으면 기준선으로 되돌립니다.
라이브 점수와 감사 트랜스크립트 전문은 공개되어 있습니다.
구성
깊이는 문서에 있습니다. 여기는 6개 능력을 한눈에 짚는 지도이고, 각 탭은 그 능력이 실제로 도는 세션을 보여줍니다.
모델 라우팅과 도구 실행을 맡는 LLM-OS 계층입니다.
프로바이더 문서 →계보 위의 정직한 자리
자기 개선 루프는 새롭지 않습니다. Promptbreeder, STOP, ADAS, DGM, GEPA가 계보를 쌓았습니다. GEODE의 기여는 재조합입니다. 그 루프를 능력에서 안전으로, 가중치에서 스캐폴드로 다시 겨누고, 공진화한 적대적 시드 위에서 돌립니다. 새로운 원형이 아니라 설계 공간의 빈 칸입니다.
- Karpathy LLM-OS
- 에이전트를 운영체제로 보는 틀을 가져왔습니다.
- Darwin Godel Machine / STOP / ADAS
- 평가 게이트 아래에서 스캐폴드를 스스로 고쳐 쓰는 구조를 가져왔습니다.
- GEPA / TextGrad
- 가중치를 건드리지 않는 반성 기반 변형을 가져왔습니다.
- Rainbow Teaming / Petri
- 공진화한 적대적 시드와 안전 감사를 가져왔습니다.