AI 워크플로우 스킬 전략 & 안정화 설계

**속도로는 Claude와 오픈소스를 이길 수 없다.** 경쟁선을 속도에서 **깊이 · 책임 · 판단 · 검증**으로 이동시킨다.

reference docs/reference/skill.md

AI 오케스트레이션 시대에 살아남는 스킬 구조와 Claude 결과물을 안정화하는 구체적 아이디어 모음

작성 맥락: FE 시니어 + AI 오케스트레이션 아키텍트 관점, gencrew 제품군(Guard, Pipeline, AITEM) 로드맵과 연동

📌 핵심 관점

속도로는 Claude와 오픈소스를 이길 수 없다. 경쟁선을 속도에서 깊이 · 책임 · 판단 · 검증으로 이동시킨다.

"Claude보다 빠를 수 없다. 하지만 Claude + 나 가 Claude 혼자보다 더 좋을 수 있다."

1. 스킬 방향성 재검토

피해야 할 스킬 (유통기한 짧음)

일반 컴포넌트 스캐폴더 (shadcn/ui, v0.dev가 이김)
일반 CRUD / 폼 템플릿
단순 보일러플레이트 생성기

AI가 이미 잘하는 영역 = 스킬화 가치 낮음

투자해야 할 스킬 (오래 살아남음)

AI 시대에 오래가는 스킬의 공통 DNA

판단을 돕는다 (코드를 만들지 않는다)
맥락을 구조화한다 (맥락 자체가 자산)
실패 시나리오를 강제한다
트레이드오프를 명시한다
근거를 요구한다

2. 스킬 분류 체계

2-1. 2계층 컴포넌트 구조 (팀 내부용)

skills/
├── common/          # 재사용 UI — 얇게만, 내부용
│   ├── common-atoms
│   ├── common-forms
│   ├── common-data-display
│   ├── common-feedback
│   └── common-layout
└── domain/          # 도메인 화면 패턴 — 2회 이상 만들어본 것만
    ├── domain-auth
    ├── domain-admin
    ├── domain-chat
    ├── domain-rag
    ├── domain-agent
    ├── domain-payment
    ├── domain-education
    ├── domain-content
    ├── domain-analytics
    └── domain-enterprise

원칙

공통 스킬은 프레임워크별로 분리 (Vue / React)
도메인 스킬은 공통 스킬을 참조 (의존성 방향 고정)
실제 2번 이상 만들어본 패턴만 스킬화

2-2. IT 전반 판단/거버넌스 스킬 (차별화 영역)

카테고리	대표 스킬
시스템 설계	system-design-interviewer, capacity-planner, consistency-chooser, monolith-vs-microservice
SRE / 운영	slo-sli-writer, incident-postmortem, runbook-generator, chaos-scenario
보안 / 규정	threat-model, secret-leak-auditor, auth-flow-designer, privacy-by-design
성능	perf-root-cause, db-query-optimizer, frontend-vitals-auditor, caching-strategy
테스트	test-pyramid-designer, flaky-test-hunter, contract-test-writer
릴리스	rollout-strategy, migration-planner, rollback-plan, feature-flag-hygiene
코드 품질	ai-generated-code-review, api-design-critic, error-handling-advisor
레거시	legacy-reading, strangler-fig-planner, data-migration
의사결정	adr-writer, rfc-writer, tech-radar-updater, design-doc-reviewer
협업	pr-description-writer, code-review-coach, estimation-helper
AI 메타	prompt-spec, context-pack, ai-output-validator, hallucination-guard
관측성	observability-designer, log-schema, alert-hygiene, dashboard-critic

3. 2027년 예측 — 미리 찍을 스킬

2026년 현재 "에이전트 오케스트레이션"이 주류화 중. 2027년은 그 다음 레이어의 문제들이 터진다.

5대 화두

다중 에이전트 협업의 충돌 조정 — 동시에 같은 코드베이스를 만지는 에이전트 간 락/트랜잭션
AI 생성 코드의 책임/감사/보험 — Provenance, 감사 로그 표준화, AI 코드 보험
컨텍스트 엔지니어링이 프롬프트 엔지니어링 대체 — 무엇을 넣을지가 아니라 무엇을 뺄지
AI가 만든 시스템의 유지보수 폭발 — 2025~2026에 쌓인 AI 기술부채가 만기
인간 엔지니어의 남은 역할 재정의 — 주니어 파이프라인 붕괴, AI 리터러시 평가

선점 스킬 (지금 찍으면 2027년에 효과)

A급 — 아직 아무도 깃발 안 꽂음

ai-tech-debt-auditor — AI 레거시 진단 도구, "최초 정의자" 포지션
context-pruner — 컨텍스트 엔지니어링 핵심
multi-agent-git-strategy — 다중 에이전트 충돌 해결

B급 — 2026 후반~2027 상반기 수요

ai-audit-trail — 규제 얘기 나오면 급등
hallucinated-abstraction-finder — 구체적이고 팔기 쉬움

C급 — 장기 포지셔닝

junior-dev-curriculum — 교육 도메인 경력과 맞물림, 유튜브 소재 강함

4. Claude 결과물 안정화 — 7-Layer 전략

AI 결과물의 불안정성을 레이어별로 방어한다. 이 구조가 곧 gencrew Guard의 피처 로드맵.

안정성의 7가지 축

정확성 (요구사항대로 동작)
일관성 (스타일/패턴 통일)
견고성 (예외/엣지케이스)
검증가능성 (테스트/타입/계약)
변경안전성 (다른 곳 안 부숨)
운영가능성 (장애 추적/복구)
이해가능성 (6개월 뒤 읽힘)

Layer 1. 입력 단계 — Claude에게 주는 것 안정화

AI 결과 불안정성의 80%는 입력이 부실한 탓

Context Contract — 모든 태스크에 {목표, 제약, 기존스타일샘플, 금지사항, 성공기준, 실패시나리오} 6개 필수
Style Anchor 3개 법칙 — 기존 파일 3개를 함께 주고 "이것과 일관되게"
Negative Example Bank — 과거 잘못된 패턴 DB화, 매 요청에 "이것처럼 만들지 마"
Constraint Pre-injection — SEED/CONSTRAINTS/DECISIONS 자동 주입 훅 (Claude Code hooks)

Layer 2. 생성 단계 — 한 번에 안 받기

N-of-M 생성 + 비교 — 3~5번 돌려 공통 구조만 채택
2-Model Pincer — Claude↔GPT 교차 리뷰로 편향 상쇄
Plan → Critique → Code — 3단계 분리, 같은 Claude라도 품질 급상승
Incremental Scaffolding — 5~10줄씩 단계별 커밋, 각 단계 독립 검증

Layer 3. 검증 단계 — AI 코드 특유의 냄새 잡기

Hallucination Checklist
- 존재하지 않는 import/API
- 과방어 try/catch
- 사용 안 되는 변수/함수
- 주석과 코드 불일치
- "TODO: implement" 유령 함수
- any/unknown 남발
- 복붙 흔적
Reverse Test — AI가 만든 코드에 AI가 테스트 먼저 작성, 못 쓰면 폐기
Semantic Diff — 단순 텍스트가 아닌 "의미 차이"로 비교
Dependency Sanity Check — 환각 패키지/라이선스/유지보수/보안 검증

Layer 4. 통합 단계 — 코드베이스 안착

Reversibility Gate (R0/R1/R2)
- R0: 자동 머지 OK
- R1: 사람 리뷰 필수
- R2: 아키텍트 승인 + 롤백 플랜
- AI 코드는 기본 R1 이상
Canary Merge — 피처 플래그 뒤 1~5% 노출 후 24시간 관찰
Blast Radius Map — 영향 범위 자동 계산, 넘으면 분할 PR 강제
AI Code Provenance Log — 어떤 모델/프롬프트/언제 기록 (2027 규제 대응)

Layer 5. 운영 단계 — 배포 후

AI Change Observability — AI 만진 경로에 자동 로깅/트레이싱
Auto-rollback Trigger — 에러율/지연시간 baseline 초과 시 자동 롤백
2-Week Soak Rule — AI 코드는 2주간 추가 AI 수정 금지, 인간이 먼저 길들임

Layer 6. 조직 단계 — 팀/프로세스

AI-PR 전용 리뷰 템플릿 — 일반 PR과 다른 체크리스트
AI 커밋 Quota — 생산성이 아닌 "소화 가능량" 기준
Paired Review — AI+인간 조합으로만 리뷰, 인간 혼자 금지
Knowledge Recycling Loop — 발견된 버그 → Negative Example에 자동 추가

Layer 7. 메타 단계 — 안정성 자체 측정

AI Code Quality Score — 100줄당 버그율/지적/롤백 추적
Incident → Rule 변환 — 인시던트 발생 시 자동으로 CONSTRAINTS.md 룰 생성
Confidence Calibration — AI 자기평가 정확도 추적, 자신감 과잉 영역 식별

5. Guard 제품 로드맵 매핑

Layer	Guard 기능 모듈
1. 입력	Context Contract 시스템, Constraint Injector
2. 생성	Cross-Model Validator, N-of-M Consensus
3. 검증	AI Hallucination Scanner, Reverse Test Enforcer
4. 통합	Reversibility Gate, Provenance Logger
5. 운영	AI-aware Observability, Auto-rollback
6. 조직	AI-PR Templates, Quality Metrics
7. 메타	AI Code Insurance Dashboard

6. 실행 우선순위

지금 당장 (2026 Q2)

Context Contract 템플릿 공개 — ai-rules 레포 추가, 표준 선점
Hallucination Checklist — 유튜브 1편 ("AI 코드의 7가지 냄새")
Reversibility Gate 데모 — R0/R1/R2 실제 PR 적용 영상, Guard 데모로 재활용

단기 (2026 하반기)

Layer 3 검증 + Layer 4 가역성을 Guard MVP로 결합
ai-rules에 Context Pre-injection 훅 추가
2-Model Pincer 자동화 스크립트

중기 (2027)

A급 선점 스킬 3개 문서화 및 타임스탬프 박기
AI Code Quality Score 측정 대시보드
엔터프라이즈 Provenance 로깅 표준 제안

7. 주의사항

⚠️ 함정 5가지

모든 레이어를 한 번에 구축하지 않는다 — 고객이 가장 아픈 3~5개부터
"안정성 = 느려짐"으로 포지셔닝 금지 — "속도 유지 + 안 부서짐"으로
철학만 있고 숫자가 없으면 망함 — 버그 감소율 등 baseline 필수
"느림"을 정당화로 끝내지 말기 — 실제로 결과물이 더 깊어야 함
AI를 거부하면 망함 — AI를 남보다 잘 써서 속도+깊이 동시 확보

⚠️ 스킬 설계 원칙

처음부터 20개 만들지 말고 현재 가장 반복하는 3~5개부터
스킬의 진짜 가치는 목록이 아니라 내부의 구체적 실패 사례/수치/체크리스트
1번만 만들어본 건 패턴이 안정화 안 된 상태 — 잘못된 표준이 굳어짐

8. SKILL.md 공통 템플릿

# [스킬명]

## When to use
언제 이 스킬을 써야 하는지

## Stack assumptions
Vue 3 / React 18 / TypeScript strict / Tailwind

## Component list / Decision criteria
컴포넌트 이름 + 한 줄 설명 / 판단 기준

## Props contract / Input-Output schema
TypeScript 타입 스펙

## Accessibility / Constraints
필수 체크 항목

## Examples
실제 사용 코드 2~3개

## Anti-patterns
이렇게 쓰면 안 되는 케이스

## Failure scenarios
실패 시 어떻게 감지/복구

📋 한 줄 요약

속도는 포기. 깊이/판단/검증/책임에 집을 짓는다. Claude를 거부하지 않고, 남보다 더 잘 써서 "Claude + 나 > Claude 혼자"를 증명한다. "AI가 만든 것의 마지막 방어선" 포지션 = gencrew의 장기 해자.