P19 완료)
| 차원 | **Superpowers** | **ai-rules (After)** | |------|----------------|---------------------| | 핵심 목표 | AI 에이전트의 **행동 패턴 교정** (워크플로우 강제) |
분석일: 2026-04-14 대상: obra/superpowers v5.0.7 이전 분석: superpowers-vs-ai-rules.md (2026-04-13, P1 이전) 변경사항: P1~P19 로드맵 완료 후 재평가
1. 프로젝트 성격 비교
| 차원 | Superpowers | ai-rules (After) |
|---|---|---|
| 핵심 목표 | AI 에이전트의 행동 패턴 교정 (워크플로우 강제) | AI 에이전트의 규칙 배포 & 거버넌스 + 프로세스 강제 |
| 접근법 | Skill 중심 — 상황별 행동 가이드 | Rule + Skill + Hook — 정책 + 프로세스 + 결정적 차단 |
| 비유 | "코치가 옆에서 방법론을 주입" | "법률 + 코치 + 경비원이 함께 작동" |
| 배포 형태 | Plugin/Marketplace (6개 플랫폼) | 내부 sync 스크립트 (YAML 프로파일) + governance adapter |
| 규모 | 15 skills, 1 agent, hooks | 10 core rules, 8 skills, 6 agents, 7 hooks, 15 profiles |
| 라이선스 | MIT | Private (OSS 준비 중) |
핵심 차이 (변화):
Before:
Superpowers = "어떻게 일하는가" (Process)
ai-rules = "무엇을 해도 되고 안 되는가" (Policy)
After:
Superpowers = "어떻게 일하는가" (Process)
ai-rules = "무엇을 해도 되고 안 되는가" (Policy)
+ "이렇게 해라" (Process — 8 skills)
+ "안 하면 막는다" (Enforcement — 7 hooks)
+ "막힌 것을 학습한다" (Self-improve — P18)
2. Superpowers 아키텍처 (변동 없음)
스킬 시스템 (15개)
계획 & 설계:
brainstorming— 소크라틱 디자인 정제writing-plans— 2-5분 단위 bite-sized 구현 계획writing-skills— 메타 스킬: 스킬 자체를 TDD로 작성
실행 & 협업:
subagent-driven-development— 태스크당 fresh 서브에이전트 + 2단계 리뷰executing-plans— 순차 실행 + 사람 체크포인트dispatching-parallel-agents— 독립 조사를 병렬 실행
코드 품질:
test-driven-development— RED-GREEN-REFACTOR 강제requesting-code-review/receiving-code-review— 서브에이전트 리뷰 프로토콜verification-before-completion— "증거 없이 완료 주장 금지"systematic-debugging— 4단계 근본원인 조사 프로세스
Git & 완료:
using-git-worktrees— 격리 브랜치 안전 체크finishing-a-development-branch— 머지/PR 가이드using-superpowers— 부트스트랩 스킬 (SessionStart 주입)
멀티 플랫폼 배포
| 플랫폼 | 방식 | 핵심 |
|---|---|---|
| Claude Code | 네이티브 플러그인 (marketplace) | SessionStart hook |
| Cursor | 네이티브 플러그인 | camelCase hooks |
| Codex | symlink + 스킬 디스커버리 | ~/.agents/skills/ |
| OpenCode | ESM 플러그인 | config hook + message transform |
| Copilot CLI | marketplace + hooks | additionalContext |
| Gemini CLI | JSON extension | activate_skill tool |
핵심 설계 패턴
- Single Source of Truth:
/skills디렉토리 하나에 모든 스킬 - SessionStart Bootstrap:
using-superpowers스킬이 세션 시작 시 자동 주입 - Rationalization Prevention: 각 스킬에 에이전트 변명 방지 테이블 포함
- SUBAGENT-STOP: 서브에이전트에서는 부트스트랩 스킬 건너뛰기 (컨텍스트 오염 방지)
- Zero-Dependency: 브라우저 컴패니언 서버가 Node.js 빌트인만 사용
3. Superpowers가 여전히 잘한 것
A. Skill = 실행 가능한 행동 단위
ai-rules (Before): "TDD 해야 한다" (규칙으로 선언)
ai-rules (After): planning/commit/debugging/code-review 스킬로 프로세스 가이드
superpowers: "RED → GREEN → REFACTOR 순서대로 하라" + 변명 방지 테이블
ai-rules가 8개 스킬을 도입하며 격차를 좁혔지만, Superpowers는 15개 스킬로 더 세분화된 시나리오(brainstorming, TDD, worktree 등)를 커버. 특히 writing-skills(메타 TDD)는 ai-rules에 없는 고유 패턴.
AI 에이전트는 "해라"보다 "이 순서로 이렇게 해라"에 훨씬 잘 반응한다. → ai-rules도 이제 스킬 기반 프로세스 가이드를 제공. 격차 축소.
B. Subagent-Driven Development 실행 프로토콜
Superpowers:
- Task마다 fresh 서브에이전트 (컨텍스트 오염 방지)
- Spec compliance review → Code quality review (2단계 리뷰)
- 전용 프롬프트:
implementer-prompt.md,spec-reviewer-prompt.md,code-quality-reviewer-prompt.md
ai-rules (After — P10):
spec-reviewer+code-reviewer분리 완료/code-review스킬이 2단계 리뷰를 자동 실행- Hallucination Checklist + Blast Radius 계산 추가
평가: 2단계 리뷰 구조는 동등. ai-rules는 Blast Radius 계산과 Hallucination Checklist로 리뷰 품질에서 앞섬. 다만 Superpowers의 fresh 서브에이전트 격리 패턴은 더 체계적.
C. 스킬 자체를 TDD로 검증 (메타 TDD)
ai-rules는 규칙 자체의 효과를 체계적으로 테스트하는 메커니즘이 없음.
ai-rules (After — P11, P16):
- P11: 19개 Hook 단위 테스트 시나리오 (Tier 1)
- P16: CI 회귀 테스트 (3x 실행, median 판정, Tier 1/2/3)
평가: 방식은 다르지만 양쪽 모두 규칙/스킬 효과를 테스트. Superpowers는 실제 세션 트랜스크립트 기반, ai-rules는 시나리오 기반 + CI 자동화. 격차 해소.
D. 경량 컨텍스트 부트스트랩
ai-rules: CLAUDE.md에 2,500줄+ 전체 규칙을 넣어 컨텍스트 부담 큼
ai-rules (After — P1, P15):
- CLAUDE.md: 2,500줄 → 409줄 (-84%)
- Lazy-load 라우팅 테이블: 필요 시 on-demand 로드
docs/reference/상세 규칙 분리
Superpowers: using-superpowers 스킬(인덱스 + 호출법)만 주입
평가: 양쪽 모두 인덱스 + 필요 시 로드 패턴. ai-rules가 409줄로 더 많지만, 핵심 금지사항(보안/git)을 always-on으로 유지하는 것은 거버넌스 목적상 합리적. 격차 해소.
E. Integration Test 인프라
Superpowers: 실제 Claude Code 세션 → .jsonl 트랜스크립트 파싱 (토큰 비용 분석 포함)
ai-rules (After — P16): CI 워크플로우 기반 회귀 테스트. 실제 세션 트랜스크립트 파싱은 미구현.
평가: Superpowers가 런타임 검증에서 여전히 앞섬. ai-rules는 시나리오 기반 테스트로 커버하지만, 실제 에이전트 세션 녹화→분석 파이프라인은 없음.
F. 엄격한 기여 기준
양쪽 모두 에이전트 PR에 대한 검증 프로토콜 보유. 동등.
4. ai-rules가 잘한 것
| 강점 | 설명 | Superpowers 대응 | 변화 |
|---|---|---|---|
| R0/R1/R2 가역성 등급 | 4축 판단 + 확인 문구 재입력 | 없음 | 유지 |
| Hook 이중화 | Advisory(CLAUDE.md) + Deterministic(7 hooks) | Advisory 의존도 높음 | 강화 (3→7) |
| Tier 2 강제력 | tier2-gate.sh — 누적 변경량 게이트 (P19) | 없음 | 신규 |
| 규칙 충돌 매트릭스 | 7개 시나리오 + 4문장 tie-breaker | 없음 (스킬 우선순위만) | 유지 |
| 프로젝트별 프로파일 | 15개 프로젝트에 다른 규칙 조합 | One-size-fits-all | 유지 |
| 세션 관리 | HANDOFF + ACTIVE_WORK + 신뢰 모델 + bootstrap hook | 없음 | 강화 (P3, P6) |
| DB 안전 규칙 | 실제 사고 기반 07-db | DB 관련 가드 없음 | 유지 |
| 변명 방지 테이블 | 4개 규칙에 18+ 패턴 (P2) | 각 스킬에 포함 | 동등 |
| 자기 개선 루프 | negative-example bank + self-improve 스킬 (P18) | writing-skills 메타 TDD | 신규 (방식 다름) |
| 거버넌스 프리셋 | solo/small-team/saas (P17, P19) | 없음 | 신규 |
| CI 회귀 테스트 | Tier 1/2/3, 3x 실행, median 판정 (P16) | .jsonl 트랜스크립트 분석 | 신규 (방식 다름) |
| 멀티 도구 adapter | 7개 adapter | 6개 플랫폼 플러그인 | 유지 |
5. 보완 제안 (After 기준 재평가)
[높음] Skill 패턴 도입 → ✅ 해결 (P5)
8개 스킬 완성. 추가 고려: tdd 스킬 (Superpowers의 RED-GREEN-REFACTOR 대응)
[높음] Rationalization Prevention Table 추가 → ✅ 해결 (P2)
01-git, 03-security, 04-lifecycle, 05-responses에 18+ 패턴 추가.
[중간] 스킬 효과 테스트 프레임워크 → ✅ 해결 (P11, P16)
19 시나리오 + CI 회귀 테스트.
[중간] SessionStart 컨텍스트 경량화 → ✅ 해결 (P1, P15)
2,500줄 → 409줄 + lazy-load.
[중간] 2단계 리뷰 프로토콜 → ✅ 해결 (P10)
spec-reviewer + code-reviewer 분리 완료.
[중간] 실제 세션 트랜스크립트 분석 (신규)
Superpowers의 .jsonl 기반 런타임 검증을 참고하여, 실제 에이전트 세션 녹화 → 규칙 준수율 자동 측정 파이프라인 구축. 현재 P18의 negative-example bank가 수동 수집이라 자동화 여지 있음.
[낮음] Plugin/Marketplace 배포
P13 미완. OSS 공개 시 Claude Code marketplace 등록 검토.
[낮음] TDD 스킬 추가
Superpowers의 test-driven-development 스킬에 대응하는 전용 TDD 프로세스 스킬. 현재 debugging.md가 일부 커버하지만 RED-GREEN-REFACTOR 순환은 미포함.
6. 결론
| 관점 | Superpowers | ai-rules (Before) | ai-rules (After) |
|---|---|---|---|
| 행동 교정 | A+ | B | A |
| 거버넌스 | C | A+ | A+ |
| 프로젝트 적응 | C | A | A |
| 테스트 가능성 | A | D | A |
| 컨텍스트 효율 | A | C | A |
| 플랫폼 배포 | A | B+ | B+ |
| 자기 개선 | B+ | D | A |
| 결정적 강제력 | C | B+ | A+ |
종합 점수
Superpowers: A- (행동 교정 최강, 거버넌스/강제력 약함)
ai-rules (Before): B (거버넌스 최강, 행동 교정/테스트 약함)
ai-rules (After): A (거버넌스 + 행동 교정 + 강제력 + 테스트 균형)
남은 격차
| Superpowers가 여전히 앞서는 것 | 이유 |
|---|---|
| 스킬 세분화 (15 vs 8) | brainstorming, TDD, worktree 등 세분화 시나리오 |
| 런타임 트랜스크립트 분석 | .jsonl 세션 녹화 → 토큰 비용까지 분석 |
| Marketplace 배포 | 6개 플랫폼 네이티브 플러그인 |
| ai-rules가 앞서는 것 | 이유 |
|---|---|
| 결정적 강제력 | 7 hooks → Tier 0~3 전체 커버 (advisory + deterministic) |
| 프로젝트별 정책 적응 | 15 프로파일 + extensions + governance 프리셋 |
| 가역성 판정 체계 | R0/R1/R2 + 확인 문구 + 예외 추적 + 만료 |
| 세션 연속성 | HANDOFF 신뢰 모델 + bootstrap hook + ACTIVE_WORK |
| 자기 개선 루프 | negative-example bank + self-improve 스킬 + 교차 검증 |
결론: P1~P19로 "규칙만 있고 강제가 없다"는 최대 약점이 해소됨. Superpowers와 상호 보완적 관계에서 대등한 경쟁 관계로 전환. 남은 차이는 스킬 세분화와 배포 방식 정도.