P19 완료)

| 차원 | **Superpowers** | **ai-rules (After)** | |------|----------------|---------------------| | 핵심 목표 | AI 에이전트의 **행동 패턴 교정** (워크플로우 강제) |

research docs/research/superpowers-vs-ai-rules-after.md

분석일: 2026-04-14 대상: obra/superpowers v5.0.7 이전 분석: superpowers-vs-ai-rules.md (2026-04-13, P1 이전) 변경사항: P1~P19 로드맵 완료 후 재평가

1. 프로젝트 성격 비교

차원	Superpowers	ai-rules (After)
핵심 목표	AI 에이전트의 행동 패턴 교정 (워크플로우 강제)	AI 에이전트의 규칙 배포 & 거버넌스 + 프로세스 강제
접근법	Skill 중심 — 상황별 행동 가이드	Rule + Skill + Hook — 정책 + 프로세스 + 결정적 차단
비유	"코치가 옆에서 방법론을 주입"	"법률 + 코치 + 경비원이 함께 작동"
배포 형태	Plugin/Marketplace (6개 플랫폼)	내부 sync 스크립트 (YAML 프로파일) + governance adapter
규모	15 skills, 1 agent, hooks	10 core rules, 8 skills, 6 agents, 7 hooks, 15 profiles
라이선스	MIT	Private (OSS 준비 중)

핵심 차이 (변화):

Before:
  Superpowers = "어떻게 일하는가" (Process)
  ai-rules    = "무엇을 해도 되고 안 되는가" (Policy)

After:
  Superpowers = "어떻게 일하는가" (Process)
  ai-rules    = "무엇을 해도 되고 안 되는가" (Policy)
               + "이렇게 해라" (Process — 8 skills)
               + "안 하면 막는다" (Enforcement — 7 hooks)
               + "막힌 것을 학습한다" (Self-improve — P18)

2. Superpowers 아키텍처 (변동 없음)

스킬 시스템 (15개)

계획 & 설계:

brainstorming — 소크라틱 디자인 정제
writing-plans — 2-5분 단위 bite-sized 구현 계획
writing-skills — 메타 스킬: 스킬 자체를 TDD로 작성

실행 & 협업:

subagent-driven-development — 태스크당 fresh 서브에이전트 + 2단계 리뷰
executing-plans — 순차 실행 + 사람 체크포인트
dispatching-parallel-agents — 독립 조사를 병렬 실행

코드 품질:

test-driven-development — RED-GREEN-REFACTOR 강제
requesting-code-review / receiving-code-review — 서브에이전트 리뷰 프로토콜
verification-before-completion — "증거 없이 완료 주장 금지"
systematic-debugging — 4단계 근본원인 조사 프로세스

Git & 완료:

using-git-worktrees — 격리 브랜치 안전 체크
finishing-a-development-branch — 머지/PR 가이드
using-superpowers — 부트스트랩 스킬 (SessionStart 주입)

멀티 플랫폼 배포

플랫폼	방식	핵심
Claude Code	네이티브 플러그인 (marketplace)	SessionStart hook
Cursor	네이티브 플러그인	camelCase hooks
Codex	symlink + 스킬 디스커버리	`~/.agents/skills/`
OpenCode	ESM 플러그인	config hook + message transform
Copilot CLI	marketplace + hooks	additionalContext
Gemini CLI	JSON extension	`activate_skill` tool

핵심 설계 패턴

Single Source of Truth: /skills 디렉토리 하나에 모든 스킬
SessionStart Bootstrap: using-superpowers 스킬이 세션 시작 시 자동 주입
Rationalization Prevention: 각 스킬에 에이전트 변명 방지 테이블 포함
SUBAGENT-STOP: 서브에이전트에서는 부트스트랩 스킬 건너뛰기 (컨텍스트 오염 방지)
Zero-Dependency: 브라우저 컴패니언 서버가 Node.js 빌트인만 사용

3. Superpowers가 여전히 잘한 것

A. Skill = 실행 가능한 행동 단위

ai-rules (Before): "TDD 해야 한다" (규칙으로 선언)
ai-rules (After):  planning/commit/debugging/code-review 스킬로 프로세스 가이드
superpowers:       "RED → GREEN → REFACTOR 순서대로 하라" + 변명 방지 테이블

ai-rules가 8개 스킬을 도입하며 격차를 좁혔지만, Superpowers는 15개 스킬로 더 세분화된 시나리오(brainstorming, TDD, worktree 등)를 커버. 특히 writing-skills(메타 TDD)는 ai-rules에 없는 고유 패턴.

~~AI 에이전트는 "해라"보다 "이 순서로 이렇게 해라"에 훨씬 잘 반응한다.~~ → ai-rules도 이제 스킬 기반 프로세스 가이드를 제공. 격차 축소.

B. Subagent-Driven Development 실행 프로토콜

Superpowers:

Task마다 fresh 서브에이전트 (컨텍스트 오염 방지)
Spec compliance review → Code quality review (2단계 리뷰)
전용 프롬프트: implementer-prompt.md, spec-reviewer-prompt.md, code-quality-reviewer-prompt.md

ai-rules (After — P10):

spec-reviewer + code-reviewer 분리 완료
/code-review 스킬이 2단계 리뷰를 자동 실행
Hallucination Checklist + Blast Radius 계산 추가

평가: 2단계 리뷰 구조는 동등. ai-rules는 Blast Radius 계산과 Hallucination Checklist로 리뷰 품질에서 앞섬. 다만 Superpowers의 fresh 서브에이전트 격리 패턴은 더 체계적.

C. 스킬 자체를 TDD로 검증 (메타 TDD)

~~ai-rules는 규칙 자체의 효과를 체계적으로 테스트하는 메커니즘이 없음.~~

ai-rules (After — P11, P16):

P11: 19개 Hook 단위 테스트 시나리오 (Tier 1)
P16: CI 회귀 테스트 (3x 실행, median 판정, Tier 1/2/3)

평가: 방식은 다르지만 양쪽 모두 규칙/스킬 효과를 테스트. Superpowers는 실제 세션 트랜스크립트 기반, ai-rules는 시나리오 기반 + CI 자동화. 격차 해소.

D. 경량 컨텍스트 부트스트랩

~~ai-rules: CLAUDE.md에 2,500줄+ 전체 규칙을 넣어 컨텍스트 부담 큼~~

ai-rules (After — P1, P15):

CLAUDE.md: 2,500줄 → 409줄 (-84%)
Lazy-load 라우팅 테이블: 필요 시 on-demand 로드
docs/reference/ 상세 규칙 분리

Superpowers: using-superpowers 스킬(인덱스 + 호출법)만 주입

평가: 양쪽 모두 인덱스 + 필요 시 로드 패턴. ai-rules가 409줄로 더 많지만, 핵심 금지사항(보안/git)을 always-on으로 유지하는 것은 거버넌스 목적상 합리적. 격차 해소.

E. Integration Test 인프라

Superpowers: 실제 Claude Code 세션 → .jsonl 트랜스크립트 파싱 (토큰 비용 분석 포함)

ai-rules (After — P16): CI 워크플로우 기반 회귀 테스트. 실제 세션 트랜스크립트 파싱은 미구현.

평가: Superpowers가 런타임 검증에서 여전히 앞섬. ai-rules는 시나리오 기반 테스트로 커버하지만, 실제 에이전트 세션 녹화→분석 파이프라인은 없음.

F. 엄격한 기여 기준

양쪽 모두 에이전트 PR에 대한 검증 프로토콜 보유. 동등.

4. ai-rules가 잘한 것

강점	설명	Superpowers 대응	변화
R0/R1/R2 가역성 등급	4축 판단 + 확인 문구 재입력	없음	유지
Hook 이중화	Advisory(CLAUDE.md) + Deterministic(7 hooks)	Advisory 의존도 높음	강화 (3→7)
Tier 2 강제력	tier2-gate.sh — 누적 변경량 게이트 (P19)	없음	신규
규칙 충돌 매트릭스	7개 시나리오 + 4문장 tie-breaker	없음 (스킬 우선순위만)	유지
프로젝트별 프로파일	15개 프로젝트에 다른 규칙 조합	One-size-fits-all	유지
세션 관리	HANDOFF + ACTIVE_WORK + 신뢰 모델 + bootstrap hook	없음	강화 (P3, P6)
DB 안전 규칙	실제 사고 기반 07-db	DB 관련 가드 없음	유지
변명 방지 테이블	4개 규칙에 18+ 패턴 (P2)	각 스킬에 포함	동등
자기 개선 루프	negative-example bank + self-improve 스킬 (P18)	writing-skills 메타 TDD	신규 (방식 다름)
거버넌스 프리셋	solo/small-team/saas (P17, P19)	없음	신규
CI 회귀 테스트	Tier 1/2/3, 3x 실행, median 판정 (P16)	.jsonl 트랜스크립트 분석	신규 (방식 다름)
멀티 도구 adapter	7개 adapter	6개 플랫폼 플러그인	유지

5. 보완 제안 (After 기준 재평가)

[높음] Skill 패턴 도입 → ✅ 해결 (P5)

8개 스킬 완성. 추가 고려: tdd 스킬 (Superpowers의 RED-GREEN-REFACTOR 대응)

[높음] Rationalization Prevention Table 추가 → ✅ 해결 (P2)

01-git, 03-security, 04-lifecycle, 05-responses에 18+ 패턴 추가.

[중간] 스킬 효과 테스트 프레임워크 → ✅ 해결 (P11, P16)

19 시나리오 + CI 회귀 테스트.

[중간] SessionStart 컨텍스트 경량화 → ✅ 해결 (P1, P15)

2,500줄 → 409줄 + lazy-load.

[중간] 2단계 리뷰 프로토콜 → ✅ 해결 (P10)

spec-reviewer + code-reviewer 분리 완료.

[중간] 실제 세션 트랜스크립트 분석 (신규)

Superpowers의 .jsonl 기반 런타임 검증을 참고하여, 실제 에이전트 세션 녹화 → 규칙 준수율 자동 측정 파이프라인 구축. 현재 P18의 negative-example bank가 수동 수집이라 자동화 여지 있음.

[낮음] Plugin/Marketplace 배포

P13 미완. OSS 공개 시 Claude Code marketplace 등록 검토.

[낮음] TDD 스킬 추가

Superpowers의 test-driven-development 스킬에 대응하는 전용 TDD 프로세스 스킬. 현재 debugging.md가 일부 커버하지만 RED-GREEN-REFACTOR 순환은 미포함.

6. 결론

관점	Superpowers	ai-rules (Before)	ai-rules (After)
행동 교정	A+	B	A
거버넌스	C	A+	A+
프로젝트 적응	C	A	A
테스트 가능성	A	D	A
컨텍스트 효율	A	C	A
플랫폼 배포	A	B+	B+
자기 개선	B+	D	A
결정적 강제력	C	B+	A+

종합 점수

Superpowers:         A- (행동 교정 최강, 거버넌스/강제력 약함)
ai-rules (Before):   B  (거버넌스 최강, 행동 교정/테스트 약함)
ai-rules (After):    A  (거버넌스 + 행동 교정 + 강제력 + 테스트 균형)

남은 격차

Superpowers가 여전히 앞서는 것	이유
스킬 세분화 (15 vs 8)	brainstorming, TDD, worktree 등 세분화 시나리오
런타임 트랜스크립트 분석	`.jsonl` 세션 녹화 → 토큰 비용까지 분석
Marketplace 배포	6개 플랫폼 네이티브 플러그인

ai-rules가 앞서는 것	이유
결정적 강제력	7 hooks → Tier 0~3 전체 커버 (advisory + deterministic)
프로젝트별 정책 적응	15 프로파일 + extensions + governance 프리셋
가역성 판정 체계	R0/R1/R2 + 확인 문구 + 예외 추적 + 만료
세션 연속성	HANDOFF 신뢰 모델 + bootstrap hook + ACTIVE_WORK
자기 개선 루프	negative-example bank + self-improve 스킬 + 교차 검증

결론: P1~P19로 "규칙만 있고 강제가 없다"는 최대 약점이 해소됨. Superpowers와 상호 보완적 관계에서 대등한 경쟁 관계로 전환. 남은 차이는 스킬 세분화와 배포 방식 정도.