ai-rules handbook ai-rules 로드맵 Before/After 비교

ai-rules 로드맵 Before/After 비교

| 지표 | Before (P1 이전) | After (P19 완료) | 변화 | |------|-----------------|-----------------|------| | CLAUDE.md 줄 수 | 2,500+ | 409 (slim) | **

research docs/research/before-after-roadmap.md

분석일: 2026-04-14 범위: P1~P19 로드맵 실행 전후 비교 참조: superpowers-vs-ai-rules.md — 개선 방향을 도출한 원본 분석


1. 핵심 수치 비교

지표 Before (P1 이전) After (P19 완료) 변화
CLAUDE.md 줄 수 2,500+ 409 (slim) -84%
스킬 (.claude/commands/) 2개 8개 +300%
Hook (.claude/hooks/) 3개 7개 +133%
에이전트 정의 4개 6개 (base) + 프로젝트별 확장 +50%
변명 방지 테이블 0개 4개 규칙에 18+ 패턴 신규
테스트 시나리오 0개 19개 (Tier 1) + CI 통합 신규
거버넌스 프리셋 0개 3개 (solo/small-team/saas) 신규
Risk Tier 커버리지 Tier 3만 hook Tier 0~3 전체 완전

2. Superpowers 비교에서 지적된 약점 → 해결 상태

superpowers-vs-ai-rules.md Section 6에서 ai-rules가 B 이하를 받은 항목:

평가 항목 Before 등급 지적 내용 해결한 P# After 등급
행동 교정 B 규칙 선언만, 프로세스 가이드 없음 P5 (스킬 5개), P2 (변명 방지) A
테스트 가능성 D 규칙 효과 측정 메커니즘 없음 P11 (테스트 프레임워크), P16 (CI 회귀) A
컨텍스트 효율 C 2,500줄+ 전체 주입 P1 (경량화), P15 (lazy-load) A
플랫폼 배포 B+ sync 기반, marketplace 없음 P13 (⬜ 미완) B+

3. 아키텍처 변화

Before: 단층 규칙 주입

CLAUDE.md (2,500줄 전체)
    ↓ 세션 시작 시 전부 로드
    ↓ 에이전트 컨텍스트 소비
  • 모든 규칙이 항상 로드됨 → 컨텍스트 낭비
  • Hook은 3개뿐 (guard-branch, guard-secrets, guard-push-force)
  • 스킬 2개 → 대부분 규칙이 "해라" 선언에 그침
  • 테스트 없음 → 규칙 효과 검증 불가

After: 다층 방어 + Lazy-Load

CLAUDE.md (409줄 — 핵심 금지 + 라우팅 테이블)
    ↓ 필요 시 on-demand 로드
    ├── .claude/commands/ (8 스킬 — 프로세스 가이드)
    ├── .claude/hooks/ (7 hook — 결정적 차단)
    ├── docs/reference/ (상세 규칙 — 필요 시 참조)
    └── .ai-governance/ (거버넌스 산출물)
         ├── safety-manifest.yaml
         ├── thresholds.yaml
         ├── negative-examples/
         └── config.yaml
  • Always-on: 핵심 금지사항만 409줄
  • On-demand: 상세 규칙은 스킬/레퍼런스로 분리, 필요 시 로드
  • Deterministic: Hook이 Tier 1~3을 결정적으로 차단
  • Advisory: 스킬이 워크플로우를 안내 (위반해도 hook이 최종 차단)
  • Self-improving: P18 자기 개선 루프로 위반 패턴 학습

4. 계층별 Before/After

4.1 스킬 (Process Guidance)

Before After (P5)
daily-scrum.md planning.md — Plan Mode 진입→분석→계획→승인
weekly-report.md commit.md — 브랜치 확인→diff→커밋→push
debugging.md — 4단계 진단 프로토콜
code-review.md — 2단계 리뷰 (spec + code)
pr-create.md — 충돌 확인→리뷰→PR 생성
daily-scrum.md — 일일 현황 리포트
weekly-report.md — 주간 보고서
self-improve.md — 위반 패턴 분석→규칙 보강

4.2 Hook (Deterministic Enforcement)

Hook Before After 담당 P#
guard-branch.sh 강화 (safety-manifest 연동) P6, P19
guard-secrets.sh
guard-push-force.sh
guard-destructive-db.sh P7
session-bootstrap.sh P6
lint-on-save.sh P7
tier2-gate.sh P19

4.3 규칙 품질 (Rule Quality)

개선 항목 Before After 담당 P#
변명 방지 테이블 없음 01-git, 03-security, 04-lifecycle, 05-responses에 18+ 패턴 P2
INTENT.md 필수 여부 필수 선택 (fallback chain) P4
04-workflow + 06-session 2개 파일 04-lifecycle 1개로 병합 P3
02-code 스택 분리 전체 포함 공통만 core, React/FastAPI는 extensions/ P14
호출 횟수 제한 없음 settings.json invocation caps P9
2단계 리뷰 reviewer 1개 spec-reviewer + code-reviewer 분리 P10

4.4 테스트 & CI (Validation)

항목 Before After 담당 P#
Hook 단위 테스트 없음 19/19 시나리오 (guard-branch 5, push-force 5, db 9) P11
CI 회귀 테스트 없음 sync-on-push.yml (Tier 1/2/3, 3x 실행, median 판정) P16
거버넌스 대시보드 없음 health-check 스크립트 + 메트릭 수집 P17
자기 개선 루프 없음 negative-example bank + 교차 검증 P18

5. 점수판 (9차원 성숙도)

차원 Before (점수) After (점수) 증거
1. 규칙 설계 깊이 ★★★★★ (5) ★★★★★ (5) R0/R1/R2, 충돌 매트릭스, tie-breaker
2. 결정적 강제력 ★★★★☆ (4) ★★★★★ (5) Tier 0~3 전체 hook 커버 (P19)
3. 프로세스 안내 ★★☆☆☆ (2) ★★★★★ (5) 8 스킬 + 변명 방지 테이블 (P2, P5)
4. 컨텍스트 효율 ★★☆☆☆ (2) ★★★★★ (5) 409줄 slim + lazy-load (P1, P15)
5. 테스트 가능성 ★☆☆☆☆ (1) ★★★★★ (5) 19 시나리오 + CI 3x 실행 (P11, P16)
6. 프로젝트 적응 ★★★★★ (5) ★★★★★ (5) 15+ 프로파일, extensions 분리
7. 세션 연속성 ★★★☆☆ (3) ★★★★★ (5) HANDOFF 신뢰 모델 + bootstrap hook (P3, P6)
8. 자기 개선 ★☆☆☆☆ (1) ★★★★★ (5) negative examples + self-improve 스킬 (P18)
9. 배포 성숙도 ★★★☆☆ (3) ★★★★☆ (4) governance adapter + 프리셋 (P13 미완)
합계 26/45 (57.8%) 44/45 (97.8%) P13만 미완 (외부 의존)

6. 미완료 항목

항목 상태 사유
P13 — Marketplace/Plugin 배포 npm/marketplace 등 외부 플랫폼 의존
P15 Phase 2 — sync 공급망 검증 부분 sync 무결성 검증 기본 구현, 서명 검증 미구현
P18 Phase 3 — 위반 로그 자동 수집 부분 negative-example bank 구조만, 자동 수집 파이프라인 미구현

7. 결론

Before: 강력한 규칙 체계이지만, "선언만 하고 강제하지 않는" advisory 의존 구조.
        에이전트가 규칙을 무시하거나 자기 합리화할 수 있는 빈틈 존재.

After:  규칙(Policy) + 프로세스(Skill) + 강제(Hook) + 검증(Test) + 학습(Self-improve)
        5계층 방어 체계 완성. 57.8% → 97.8% 성숙도.

가장 큰 변화: "해라"(규칙) → "이렇게 해라"(스킬) → "안 하면 막는다"(hook) → "막힌 것을 학습한다"(자기 개선) 순환 구조 완성.