ai-rules handbook P19 완료)

P19 완료)

| 차원 | **Superpowers** | **ai-rules (After)** | |------|----------------|---------------------| | 핵심 목표 | AI 에이전트의 **행동 패턴 교정** (워크플로우 강제) |

research docs/research/superpowers-vs-ai-rules-after.md

분석일: 2026-04-14 대상: obra/superpowers v5.0.7 이전 분석: superpowers-vs-ai-rules.md (2026-04-13, P1 이전) 변경사항: P1~P19 로드맵 완료 후 재평가

1. 프로젝트 성격 비교

차원 Superpowers ai-rules (After)
핵심 목표 AI 에이전트의 행동 패턴 교정 (워크플로우 강제) AI 에이전트의 규칙 배포 & 거버넌스 + 프로세스 강제
접근법 Skill 중심 — 상황별 행동 가이드 Rule + Skill + Hook — 정책 + 프로세스 + 결정적 차단
비유 "코치가 옆에서 방법론을 주입" "법률 + 코치 + 경비원이 함께 작동"
배포 형태 Plugin/Marketplace (6개 플랫폼) 내부 sync 스크립트 (YAML 프로파일) + governance adapter
규모 15 skills, 1 agent, hooks 10 core rules, 8 skills, 6 agents, 7 hooks, 15 profiles
라이선스 MIT Private (OSS 준비 중)

핵심 차이 (변화):

Before:
  Superpowers = "어떻게 일하는가" (Process)
  ai-rules    = "무엇을 해도 되고 안 되는가" (Policy)

After:
  Superpowers = "어떻게 일하는가" (Process)
  ai-rules    = "무엇을 해도 되고 안 되는가" (Policy)
               + "이렇게 해라" (Process — 8 skills)
               + "안 하면 막는다" (Enforcement — 7 hooks)
               + "막힌 것을 학습한다" (Self-improve — P18)

2. Superpowers 아키텍처 (변동 없음)

스킬 시스템 (15개)

계획 & 설계:

  • brainstorming — 소크라틱 디자인 정제
  • writing-plans — 2-5분 단위 bite-sized 구현 계획
  • writing-skills — 메타 스킬: 스킬 자체를 TDD로 작성

실행 & 협업:

  • subagent-driven-development — 태스크당 fresh 서브에이전트 + 2단계 리뷰
  • executing-plans — 순차 실행 + 사람 체크포인트
  • dispatching-parallel-agents — 독립 조사를 병렬 실행

코드 품질:

  • test-driven-development — RED-GREEN-REFACTOR 강제
  • requesting-code-review / receiving-code-review — 서브에이전트 리뷰 프로토콜
  • verification-before-completion — "증거 없이 완료 주장 금지"
  • systematic-debugging — 4단계 근본원인 조사 프로세스

Git & 완료:

  • using-git-worktrees — 격리 브랜치 안전 체크
  • finishing-a-development-branch — 머지/PR 가이드
  • using-superpowers — 부트스트랩 스킬 (SessionStart 주입)

멀티 플랫폼 배포

플랫폼 방식 핵심
Claude Code 네이티브 플러그인 (marketplace) SessionStart hook
Cursor 네이티브 플러그인 camelCase hooks
Codex symlink + 스킬 디스커버리 ~/.agents/skills/
OpenCode ESM 플러그인 config hook + message transform
Copilot CLI marketplace + hooks additionalContext
Gemini CLI JSON extension activate_skill tool

핵심 설계 패턴

  1. Single Source of Truth: /skills 디렉토리 하나에 모든 스킬
  2. SessionStart Bootstrap: using-superpowers 스킬이 세션 시작 시 자동 주입
  3. Rationalization Prevention: 각 스킬에 에이전트 변명 방지 테이블 포함
  4. SUBAGENT-STOP: 서브에이전트에서는 부트스트랩 스킬 건너뛰기 (컨텍스트 오염 방지)
  5. Zero-Dependency: 브라우저 컴패니언 서버가 Node.js 빌트인만 사용

3. Superpowers가 여전히 잘한 것

A. Skill = 실행 가능한 행동 단위

ai-rules (Before): "TDD 해야 한다" (규칙으로 선언)
ai-rules (After):  planning/commit/debugging/code-review 스킬로 프로세스 가이드
superpowers:       "RED → GREEN → REFACTOR 순서대로 하라" + 변명 방지 테이블

ai-rules가 8개 스킬을 도입하며 격차를 좁혔지만, Superpowers는 15개 스킬로 더 세분화된 시나리오(brainstorming, TDD, worktree 등)를 커버. 특히 writing-skills(메타 TDD)는 ai-rules에 없는 고유 패턴.

AI 에이전트는 "해라"보다 "이 순서로 이렇게 해라"에 훨씬 잘 반응한다. → ai-rules도 이제 스킬 기반 프로세스 가이드를 제공. 격차 축소.

B. Subagent-Driven Development 실행 프로토콜

Superpowers:

  1. Task마다 fresh 서브에이전트 (컨텍스트 오염 방지)
  2. Spec compliance review → Code quality review (2단계 리뷰)
  3. 전용 프롬프트: implementer-prompt.md, spec-reviewer-prompt.md, code-quality-reviewer-prompt.md

ai-rules (After — P10):

  1. spec-reviewer + code-reviewer 분리 완료
  2. /code-review 스킬이 2단계 리뷰를 자동 실행
  3. Hallucination Checklist + Blast Radius 계산 추가

평가: 2단계 리뷰 구조는 동등. ai-rules는 Blast Radius 계산과 Hallucination Checklist로 리뷰 품질에서 앞섬. 다만 Superpowers의 fresh 서브에이전트 격리 패턴은 더 체계적.

C. 스킬 자체를 TDD로 검증 (메타 TDD)

ai-rules는 규칙 자체의 효과를 체계적으로 테스트하는 메커니즘이 없음.

ai-rules (After — P11, P16):

  • P11: 19개 Hook 단위 테스트 시나리오 (Tier 1)
  • P16: CI 회귀 테스트 (3x 실행, median 판정, Tier 1/2/3)

평가: 방식은 다르지만 양쪽 모두 규칙/스킬 효과를 테스트. Superpowers는 실제 세션 트랜스크립트 기반, ai-rules는 시나리오 기반 + CI 자동화. 격차 해소.

D. 경량 컨텍스트 부트스트랩

ai-rules: CLAUDE.md에 2,500줄+ 전체 규칙을 넣어 컨텍스트 부담 큼

ai-rules (After — P1, P15):

  • CLAUDE.md: 2,500줄 → 409줄 (-84%)
  • Lazy-load 라우팅 테이블: 필요 시 on-demand 로드
  • docs/reference/ 상세 규칙 분리

Superpowers: using-superpowers 스킬(인덱스 + 호출법)만 주입

평가: 양쪽 모두 인덱스 + 필요 시 로드 패턴. ai-rules가 409줄로 더 많지만, 핵심 금지사항(보안/git)을 always-on으로 유지하는 것은 거버넌스 목적상 합리적. 격차 해소.

E. Integration Test 인프라

Superpowers: 실제 Claude Code 세션 → .jsonl 트랜스크립트 파싱 (토큰 비용 분석 포함)

ai-rules (After — P16): CI 워크플로우 기반 회귀 테스트. 실제 세션 트랜스크립트 파싱은 미구현.

평가: Superpowers가 런타임 검증에서 여전히 앞섬. ai-rules는 시나리오 기반 테스트로 커버하지만, 실제 에이전트 세션 녹화→분석 파이프라인은 없음.

F. 엄격한 기여 기준

양쪽 모두 에이전트 PR에 대한 검증 프로토콜 보유. 동등.


4. ai-rules가 잘한 것

강점 설명 Superpowers 대응 변화
R0/R1/R2 가역성 등급 4축 판단 + 확인 문구 재입력 없음 유지
Hook 이중화 Advisory(CLAUDE.md) + Deterministic(7 hooks) Advisory 의존도 높음 강화 (3→7)
Tier 2 강제력 tier2-gate.sh — 누적 변경량 게이트 (P19) 없음 신규
규칙 충돌 매트릭스 7개 시나리오 + 4문장 tie-breaker 없음 (스킬 우선순위만) 유지
프로젝트별 프로파일 15개 프로젝트에 다른 규칙 조합 One-size-fits-all 유지
세션 관리 HANDOFF + ACTIVE_WORK + 신뢰 모델 + bootstrap hook 없음 강화 (P3, P6)
DB 안전 규칙 실제 사고 기반 07-db DB 관련 가드 없음 유지
변명 방지 테이블 4개 규칙에 18+ 패턴 (P2) 각 스킬에 포함 동등
자기 개선 루프 negative-example bank + self-improve 스킬 (P18) writing-skills 메타 TDD 신규 (방식 다름)
거버넌스 프리셋 solo/small-team/saas (P17, P19) 없음 신규
CI 회귀 테스트 Tier 1/2/3, 3x 실행, median 판정 (P16) .jsonl 트랜스크립트 분석 신규 (방식 다름)
멀티 도구 adapter 7개 adapter 6개 플랫폼 플러그인 유지

5. 보완 제안 (After 기준 재평가)

[높음] Skill 패턴 도입 해결 (P5)

8개 스킬 완성. 추가 고려: tdd 스킬 (Superpowers의 RED-GREEN-REFACTOR 대응)

[높음] Rationalization Prevention Table 추가 해결 (P2)

01-git, 03-security, 04-lifecycle, 05-responses에 18+ 패턴 추가.

[중간] 스킬 효과 테스트 프레임워크 해결 (P11, P16)

19 시나리오 + CI 회귀 테스트.

[중간] SessionStart 컨텍스트 경량화 해결 (P1, P15)

2,500줄 → 409줄 + lazy-load.

[중간] 2단계 리뷰 프로토콜 해결 (P10)

spec-reviewer + code-reviewer 분리 완료.

[중간] 실제 세션 트랜스크립트 분석 (신규)

Superpowers의 .jsonl 기반 런타임 검증을 참고하여, 실제 에이전트 세션 녹화 → 규칙 준수율 자동 측정 파이프라인 구축. 현재 P18의 negative-example bank가 수동 수집이라 자동화 여지 있음.

[낮음] Plugin/Marketplace 배포

P13 미완. OSS 공개 시 Claude Code marketplace 등록 검토.

[낮음] TDD 스킬 추가

Superpowers의 test-driven-development 스킬에 대응하는 전용 TDD 프로세스 스킬. 현재 debugging.md가 일부 커버하지만 RED-GREEN-REFACTOR 순환은 미포함.


6. 결론

관점 Superpowers ai-rules (Before) ai-rules (After)
행동 교정 A+ B A
거버넌스 C A+ A+
프로젝트 적응 C A A
테스트 가능성 A D A
컨텍스트 효율 A C A
플랫폼 배포 A B+ B+
자기 개선 B+ D A
결정적 강제력 C B+ A+

종합 점수

Superpowers:         A- (행동 교정 최강, 거버넌스/강제력 약함)
ai-rules (Before):   B  (거버넌스 최강, 행동 교정/테스트 약함)
ai-rules (After):    A  (거버넌스 + 행동 교정 + 강제력 + 테스트 균형)

남은 격차

Superpowers가 여전히 앞서는 것 이유
스킬 세분화 (15 vs 8) brainstorming, TDD, worktree 등 세분화 시나리오
런타임 트랜스크립트 분석 .jsonl 세션 녹화 → 토큰 비용까지 분석
Marketplace 배포 6개 플랫폼 네이티브 플러그인
ai-rules가 앞서는 것 이유
결정적 강제력 7 hooks → Tier 0~3 전체 커버 (advisory + deterministic)
프로젝트별 정책 적응 15 프로파일 + extensions + governance 프리셋
가역성 판정 체계 R0/R1/R2 + 확인 문구 + 예외 추적 + 만료
세션 연속성 HANDOFF 신뢰 모델 + bootstrap hook + ACTIVE_WORK
자기 개선 루프 negative-example bank + self-improve 스킬 + 교차 검증

결론: P1~P19로 "규칙만 있고 강제가 없다"는 최대 약점이 해소됨. Superpowers와 상호 보완적 관계에서 대등한 경쟁 관계로 전환. 남은 차이는 스킬 세분화와 배포 방식 정도.