ai-rules 로드맵 Before/After 비교

| 지표 | Before (P1 이전) | After (P19 완료) | 변화 | |------|-----------------|-----------------|------| | CLAUDE.md 줄 수 | 2,500+ | 409 (slim) | **

research docs/research/before-after-roadmap.md

분석일: 2026-04-14 범위: P1~P19 로드맵 실행 전후 비교 참조: superpowers-vs-ai-rules.md — 개선 방향을 도출한 원본 분석

1. 핵심 수치 비교

지표	Before (P1 이전)	After (P19 완료)	변화
CLAUDE.md 줄 수	2,500+	409 (slim)	-84%
스킬 (`.claude/commands/`)	2개	8개	+300%
Hook (`.claude/hooks/`)	3개	7개	+133%
에이전트 정의	4개	6개 (base) + 프로젝트별 확장	+50%
변명 방지 테이블	0개	4개 규칙에 18+ 패턴	신규
테스트 시나리오	0개	19개 (Tier 1) + CI 통합	신규
거버넌스 프리셋	0개	3개 (solo/small-team/saas)	신규
Risk Tier 커버리지	Tier 3만 hook	Tier 0~3 전체	완전

2. Superpowers 비교에서 지적된 약점 → 해결 상태

superpowers-vs-ai-rules.md Section 6에서 ai-rules가 B 이하를 받은 항목:

평가 항목	Before 등급	지적 내용	해결한 P#	After 등급
행동 교정	B	규칙 선언만, 프로세스 가이드 없음	P5 (스킬 5개), P2 (변명 방지)	A
테스트 가능성	D	규칙 효과 측정 메커니즘 없음	P11 (테스트 프레임워크), P16 (CI 회귀)	A
컨텍스트 효율	C	2,500줄+ 전체 주입	P1 (경량화), P15 (lazy-load)	A
플랫폼 배포	B+	sync 기반, marketplace 없음	P13 (⬜ 미완)	B+

3. 아키텍처 변화

Before: 단층 규칙 주입

CLAUDE.md (2,500줄 전체)
    ↓ 세션 시작 시 전부 로드
    ↓ 에이전트 컨텍스트 소비

모든 규칙이 항상 로드됨 → 컨텍스트 낭비
Hook은 3개뿐 (guard-branch, guard-secrets, guard-push-force)
스킬 2개 → 대부분 규칙이 "해라" 선언에 그침
테스트 없음 → 규칙 효과 검증 불가

After: 다층 방어 + Lazy-Load

CLAUDE.md (409줄 — 핵심 금지 + 라우팅 테이블)
    ↓ 필요 시 on-demand 로드
    ├── .claude/commands/ (8 스킬 — 프로세스 가이드)
    ├── .claude/hooks/ (7 hook — 결정적 차단)
    ├── docs/reference/ (상세 규칙 — 필요 시 참조)
    └── .ai-governance/ (거버넌스 산출물)
         ├── safety-manifest.yaml
         ├── thresholds.yaml
         ├── negative-examples/
         └── config.yaml

Always-on: 핵심 금지사항만 409줄
On-demand: 상세 규칙은 스킬/레퍼런스로 분리, 필요 시 로드
Deterministic: Hook이 Tier 1~3을 결정적으로 차단
Advisory: 스킬이 워크플로우를 안내 (위반해도 hook이 최종 차단)
Self-improving: P18 자기 개선 루프로 위반 패턴 학습

4. 계층별 Before/After

4.1 스킬 (Process Guidance)

Before	After (P5)
`daily-scrum.md`	`planning.md` — Plan Mode 진입→분석→계획→승인
`weekly-report.md`	`commit.md` — 브랜치 확인→diff→커밋→push
	`debugging.md` — 4단계 진단 프로토콜
	`code-review.md` — 2단계 리뷰 (spec + code)
	`pr-create.md` — 충돌 확인→리뷰→PR 생성
	`daily-scrum.md` — 일일 현황 리포트
	`weekly-report.md` — 주간 보고서
	`self-improve.md` — 위반 패턴 분석→규칙 보강

4.2 Hook (Deterministic Enforcement)

Hook	Before	After	담당 P#
`guard-branch.sh`	✅	✅ 강화 (safety-manifest 연동)	P6, P19
`guard-secrets.sh`	✅	✅	—
`guard-push-force.sh`	✅	✅	—
`guard-destructive-db.sh`	—	✅	P7
`session-bootstrap.sh`	—	✅	P6
`lint-on-save.sh`	—	✅	P7
`tier2-gate.sh`	—	✅	P19

4.3 규칙 품질 (Rule Quality)

개선 항목	Before	After	담당 P#
변명 방지 테이블	없음	01-git, 03-security, 04-lifecycle, 05-responses에 18+ 패턴	P2
INTENT.md 필수 여부	필수	선택 (fallback chain)	P4
04-workflow + 06-session	2개 파일	04-lifecycle 1개로 병합	P3
02-code 스택 분리	전체 포함	공통만 core, React/FastAPI는 extensions/	P14
호출 횟수 제한	없음	settings.json invocation caps	P9
2단계 리뷰	reviewer 1개	spec-reviewer + code-reviewer 분리	P10

4.4 테스트 & CI (Validation)

항목	Before	After	담당 P#
Hook 단위 테스트	없음	19/19 시나리오 (guard-branch 5, push-force 5, db 9)	P11
CI 회귀 테스트	없음	sync-on-push.yml (Tier 1/2/3, 3x 실행, median 판정)	P16
거버넌스 대시보드	없음	health-check 스크립트 + 메트릭 수집	P17
자기 개선 루프	없음	negative-example bank + 교차 검증	P18

5. 점수판 (9차원 성숙도)

차원	Before (점수)	After (점수)	증거
1. 규칙 설계 깊이	★★★★★ (5)	★★★★★ (5)	R0/R1/R2, 충돌 매트릭스, tie-breaker
2. 결정적 강제력	★★★★☆ (4)	★★★★★ (5)	Tier 0~3 전체 hook 커버 (P19)
3. 프로세스 안내	★★☆☆☆ (2)	★★★★★ (5)	8 스킬 + 변명 방지 테이블 (P2, P5)
4. 컨텍스트 효율	★★☆☆☆ (2)	★★★★★ (5)	409줄 slim + lazy-load (P1, P15)
5. 테스트 가능성	★☆☆☆☆ (1)	★★★★★ (5)	19 시나리오 + CI 3x 실행 (P11, P16)
6. 프로젝트 적응	★★★★★ (5)	★★★★★ (5)	15+ 프로파일, extensions 분리
7. 세션 연속성	★★★☆☆ (3)	★★★★★ (5)	HANDOFF 신뢰 모델 + bootstrap hook (P3, P6)
8. 자기 개선	★☆☆☆☆ (1)	★★★★★ (5)	negative examples + self-improve 스킬 (P18)
9. 배포 성숙도	★★★☆☆ (3)	★★★★☆ (4)	governance adapter + 프리셋 (P13 미완)
합계	26/45 (57.8%)	44/45 (97.8%)	P13만 미완 (외부 의존)

6. 미완료 항목

항목	상태	사유
P13 — Marketplace/Plugin 배포	⬜	npm/marketplace 등 외부 플랫폼 의존
P15 Phase 2 — sync 공급망 검증	부분	sync 무결성 검증 기본 구현, 서명 검증 미구현
P18 Phase 3 — 위반 로그 자동 수집	부분	negative-example bank 구조만, 자동 수집 파이프라인 미구현

7. 결론

Before: 강력한 규칙 체계이지만, "선언만 하고 강제하지 않는" advisory 의존 구조.
        에이전트가 규칙을 무시하거나 자기 합리화할 수 있는 빈틈 존재.

After:  규칙(Policy) + 프로세스(Skill) + 강제(Hook) + 검증(Test) + 학습(Self-improve)
        5계층 방어 체계 완성. 57.8% → 97.8% 성숙도.

가장 큰 변화: "해라"(규칙) → "이렇게 해라"(스킬) → "안 하면 막는다"(hook) → "막힌 것을 학습한다"(자기 개선) 순환 구조 완성.