ai-rules handbook AI 워크플로우 스킬 전략 & 안정화 설계

AI 워크플로우 스킬 전략 & 안정화 설계

**속도로는 Claude와 오픈소스를 이길 수 없다.** 경쟁선을 속도에서 **깊이 · 책임 · 판단 · 검증**으로 이동시킨다.

reference docs/reference/skill.md

AI 오케스트레이션 시대에 살아남는 스킬 구조와 Claude 결과물을 안정화하는 구체적 아이디어 모음

작성 맥락: FE 시니어 + AI 오케스트레이션 아키텍트 관점, gencrew 제품군(Guard, Pipeline, AITEM) 로드맵과 연동


📌 핵심 관점

속도로는 Claude와 오픈소스를 이길 수 없다. 경쟁선을 속도에서 깊이 · 책임 · 판단 · 검증으로 이동시킨다.

"Claude보다 빠를 수 없다. 하지만 Claude + 나 가 Claude 혼자보다 더 좋을 수 있다."


1. 스킬 방향성 재검토

피해야 할 스킬 (유통기한 짧음)

  • 일반 컴포넌트 스캐폴더 (shadcn/ui, v0.dev가 이김)
  • 일반 CRUD / 폼 템플릿
  • 단순 보일러플레이트 생성기

AI가 이미 잘하는 영역 = 스킬화 가치 낮음

투자해야 할 스킬 (오래 살아남음)

AI 시대에 오래가는 스킬의 공통 DNA

  1. 판단을 돕는다 (코드를 만들지 않는다)
  2. 맥락을 구조화한다 (맥락 자체가 자산)
  3. 실패 시나리오를 강제한다
  4. 트레이드오프를 명시한다
  5. 근거를 요구한다

2. 스킬 분류 체계

2-1. 2계층 컴포넌트 구조 (팀 내부용)

skills/
├── common/          # 재사용 UI — 얇게만, 내부용
│   ├── common-atoms
│   ├── common-forms
│   ├── common-data-display
│   ├── common-feedback
│   └── common-layout
└── domain/          # 도메인 화면 패턴 — 2회 이상 만들어본 것만
    ├── domain-auth
    ├── domain-admin
    ├── domain-chat
    ├── domain-rag
    ├── domain-agent
    ├── domain-payment
    ├── domain-education
    ├── domain-content
    ├── domain-analytics
    └── domain-enterprise

원칙

  • 공통 스킬은 프레임워크별로 분리 (Vue / React)
  • 도메인 스킬은 공통 스킬을 참조 (의존성 방향 고정)
  • 실제 2번 이상 만들어본 패턴만 스킬화

2-2. IT 전반 판단/거버넌스 스킬 (차별화 영역)

카테고리 대표 스킬
시스템 설계 system-design-interviewer, capacity-planner, consistency-chooser, monolith-vs-microservice
SRE / 운영 slo-sli-writer, incident-postmortem, runbook-generator, chaos-scenario
보안 / 규정 threat-model, secret-leak-auditor, auth-flow-designer, privacy-by-design
성능 perf-root-cause, db-query-optimizer, frontend-vitals-auditor, caching-strategy
테스트 test-pyramid-designer, flaky-test-hunter, contract-test-writer
릴리스 rollout-strategy, migration-planner, rollback-plan, feature-flag-hygiene
코드 품질 ai-generated-code-review, api-design-critic, error-handling-advisor
레거시 legacy-reading, strangler-fig-planner, data-migration
의사결정 adr-writer, rfc-writer, tech-radar-updater, design-doc-reviewer
협업 pr-description-writer, code-review-coach, estimation-helper
AI 메타 prompt-spec, context-pack, ai-output-validator, hallucination-guard
관측성 observability-designer, log-schema, alert-hygiene, dashboard-critic

3. 2027년 예측 — 미리 찍을 스킬

2026년 현재 "에이전트 오케스트레이션"이 주류화 중. 2027년은 그 다음 레이어의 문제들이 터진다.

5대 화두

  1. 다중 에이전트 협업의 충돌 조정 — 동시에 같은 코드베이스를 만지는 에이전트 간 락/트랜잭션
  2. AI 생성 코드의 책임/감사/보험 — Provenance, 감사 로그 표준화, AI 코드 보험
  3. 컨텍스트 엔지니어링이 프롬프트 엔지니어링 대체 — 무엇을 넣을지가 아니라 무엇을 뺄지
  4. AI가 만든 시스템의 유지보수 폭발 — 2025~2026에 쌓인 AI 기술부채가 만기
  5. 인간 엔지니어의 남은 역할 재정의 — 주니어 파이프라인 붕괴, AI 리터러시 평가

선점 스킬 (지금 찍으면 2027년에 효과)

A급 — 아직 아무도 깃발 안 꽂음

  • ai-tech-debt-auditor — AI 레거시 진단 도구, "최초 정의자" 포지션
  • context-pruner — 컨텍스트 엔지니어링 핵심
  • multi-agent-git-strategy — 다중 에이전트 충돌 해결

B급 — 2026 후반~2027 상반기 수요

  • ai-audit-trail — 규제 얘기 나오면 급등
  • hallucinated-abstraction-finder — 구체적이고 팔기 쉬움

C급 — 장기 포지셔닝

  • junior-dev-curriculum — 교육 도메인 경력과 맞물림, 유튜브 소재 강함

4. Claude 결과물 안정화 — 7-Layer 전략

AI 결과물의 불안정성을 레이어별로 방어한다. 이 구조가 곧 gencrew Guard의 피처 로드맵.

안정성의 7가지 축

  1. 정확성 (요구사항대로 동작)
  2. 일관성 (스타일/패턴 통일)
  3. 견고성 (예외/엣지케이스)
  4. 검증가능성 (테스트/타입/계약)
  5. 변경안전성 (다른 곳 안 부숨)
  6. 운영가능성 (장애 추적/복구)
  7. 이해가능성 (6개월 뒤 읽힘)

Layer 1. 입력 단계 — Claude에게 주는 것 안정화

AI 결과 불안정성의 80%는 입력이 부실한 탓

  • Context Contract — 모든 태스크에 {목표, 제약, 기존스타일샘플, 금지사항, 성공기준, 실패시나리오} 6개 필수
  • Style Anchor 3개 법칙 — 기존 파일 3개를 함께 주고 "이것과 일관되게"
  • Negative Example Bank — 과거 잘못된 패턴 DB화, 매 요청에 "이것처럼 만들지 마"
  • Constraint Pre-injection — SEED/CONSTRAINTS/DECISIONS 자동 주입 훅 (Claude Code hooks)

Layer 2. 생성 단계 — 한 번에 안 받기

  • N-of-M 생성 + 비교 — 3~5번 돌려 공통 구조만 채택
  • 2-Model Pincer — Claude↔GPT 교차 리뷰로 편향 상쇄
  • Plan → Critique → Code — 3단계 분리, 같은 Claude라도 품질 급상승
  • Incremental Scaffolding — 5~10줄씩 단계별 커밋, 각 단계 독립 검증

Layer 3. 검증 단계 — AI 코드 특유의 냄새 잡기

  • Hallucination Checklist
    • 존재하지 않는 import/API
    • 과방어 try/catch
    • 사용 안 되는 변수/함수
    • 주석과 코드 불일치
    • "TODO: implement" 유령 함수
    • any/unknown 남발
    • 복붙 흔적
  • Reverse Test — AI가 만든 코드에 AI가 테스트 먼저 작성, 못 쓰면 폐기
  • Semantic Diff — 단순 텍스트가 아닌 "의미 차이"로 비교
  • Dependency Sanity Check — 환각 패키지/라이선스/유지보수/보안 검증

Layer 4. 통합 단계 — 코드베이스 안착

  • Reversibility Gate (R0/R1/R2)
    • R0: 자동 머지 OK
    • R1: 사람 리뷰 필수
    • R2: 아키텍트 승인 + 롤백 플랜
    • AI 코드는 기본 R1 이상
  • Canary Merge — 피처 플래그 뒤 1~5% 노출 후 24시간 관찰
  • Blast Radius Map — 영향 범위 자동 계산, 넘으면 분할 PR 강제
  • AI Code Provenance Log — 어떤 모델/프롬프트/언제 기록 (2027 규제 대응)

Layer 5. 운영 단계 — 배포 후

  • AI Change Observability — AI 만진 경로에 자동 로깅/트레이싱
  • Auto-rollback Trigger — 에러율/지연시간 baseline 초과 시 자동 롤백
  • 2-Week Soak Rule — AI 코드는 2주간 추가 AI 수정 금지, 인간이 먼저 길들임

Layer 6. 조직 단계 — 팀/프로세스

  • AI-PR 전용 리뷰 템플릿 — 일반 PR과 다른 체크리스트
  • AI 커밋 Quota — 생산성이 아닌 "소화 가능량" 기준
  • Paired Review — AI+인간 조합으로만 리뷰, 인간 혼자 금지
  • Knowledge Recycling Loop — 발견된 버그 → Negative Example에 자동 추가

Layer 7. 메타 단계 — 안정성 자체 측정

  • AI Code Quality Score — 100줄당 버그율/지적/롤백 추적
  • Incident → Rule 변환 — 인시던트 발생 시 자동으로 CONSTRAINTS.md 룰 생성
  • Confidence Calibration — AI 자기평가 정확도 추적, 자신감 과잉 영역 식별

5. Guard 제품 로드맵 매핑

Layer Guard 기능 모듈
1. 입력 Context Contract 시스템, Constraint Injector
2. 생성 Cross-Model Validator, N-of-M Consensus
3. 검증 AI Hallucination Scanner, Reverse Test Enforcer
4. 통합 Reversibility Gate, Provenance Logger
5. 운영 AI-aware Observability, Auto-rollback
6. 조직 AI-PR Templates, Quality Metrics
7. 메타 AI Code Insurance Dashboard

6. 실행 우선순위

지금 당장 (2026 Q2)

  1. Context Contract 템플릿 공개ai-rules 레포 추가, 표준 선점
  2. Hallucination Checklist — 유튜브 1편 ("AI 코드의 7가지 냄새")
  3. Reversibility Gate 데모 — R0/R1/R2 실제 PR 적용 영상, Guard 데모로 재활용

단기 (2026 하반기)

  • Layer 3 검증 + Layer 4 가역성을 Guard MVP로 결합
  • ai-rules에 Context Pre-injection 훅 추가
  • 2-Model Pincer 자동화 스크립트

중기 (2027)

  • A급 선점 스킬 3개 문서화 및 타임스탬프 박기
  • AI Code Quality Score 측정 대시보드
  • 엔터프라이즈 Provenance 로깅 표준 제안

7. 주의사항

⚠️ 함정 5가지

  1. 모든 레이어를 한 번에 구축하지 않는다 — 고객이 가장 아픈 3~5개부터
  2. "안정성 = 느려짐"으로 포지셔닝 금지 — "속도 유지 + 안 부서짐"으로
  3. 철학만 있고 숫자가 없으면 망함 — 버그 감소율 등 baseline 필수
  4. "느림"을 정당화로 끝내지 말기 — 실제로 결과물이 더 깊어야 함
  5. AI를 거부하면 망함 — AI를 남보다 잘 써서 속도+깊이 동시 확보

⚠️ 스킬 설계 원칙

  • 처음부터 20개 만들지 말고 현재 가장 반복하는 3~5개부터
  • 스킬의 진짜 가치는 목록이 아니라 내부의 구체적 실패 사례/수치/체크리스트
  • 1번만 만들어본 건 패턴이 안정화 안 된 상태 — 잘못된 표준이 굳어짐

8. SKILL.md 공통 템플릿

# [스킬명]

## When to use
언제 이 스킬을 써야 하는지

## Stack assumptions
Vue 3 / React 18 / TypeScript strict / Tailwind

## Component list / Decision criteria
컴포넌트 이름 + 한 줄 설명 / 판단 기준

## Props contract / Input-Output schema
TypeScript 타입 스펙

## Accessibility / Constraints
필수 체크 항목

## Examples
실제 사용 코드 2~3개

## Anti-patterns
이렇게 쓰면 안 되는 케이스

## Failure scenarios
실패 시 어떻게 감지/복구

📋 한 줄 요약

속도는 포기. 깊이/판단/검증/책임에 집을 짓는다. Claude를 거부하지 않고, 남보다 더 잘 써서 "Claude + 나 > Claude 혼자"를 증명한다. "AI가 만든 것의 마지막 방어선" 포지션 = gencrew의 장기 해자.