Agentic Engineering

Оптимизируйте рабочий процесс AI-кодинга с Agentic Engineering. Освойте декомпозицию задач, маршрутизацию моделей и циклы eval-first для высокопроизводительных проектов Claude Code.

Продуктивность и workflow ★ 172,650 GitHub (172,650 ★)

Agentic Engineering — это специализированный навык, предназначенный для превращения Claude Code в высокопроизводительного автономного разработчика за счёт внедрения строгой методологии взаимодействия человека и ИИ. Он выходит за рамки простого промптинга, реализуя цикл исполнения с приоритетом оценки (eval-first), где критерии завершения и тесты определяются до начала написания кода. Навык предоставляет фреймворк для разбивки сложных функций на проверяемые 15-минутные блоки, интеллектуальной маршрутизации задач между уровнями моделей (Haiku, Sonnet, Opus) в зависимости от сложности и фокусировки человеческого контроля на высокорисковых архитектурных инвариантах, а не на стилистических мелочах.

Ключевые возможности

01172 650 звёзд на GitHub

02Интеллектуальная маршрутизация моделей: оптимизация затрат путём назначения задач Haiku, Sonnet или Opus в зависимости от требуемых рассуждений.

03Декомпозиция задач на 15-минутные блоки: разбивка сложных рабочих процессов на мелкие проверяемые единицы с одним основным риском.

04Исполнение с приоритетом оценки: определение тестов функциональности и регрессии до начала любой реализации.

05Управление стратегией сессий: рекомендации о том, когда продолжать или обновлять сессии для поддержания оптимального контекста и производительности.

06Фокус проверки на рисках: приоритизация граничных случаев, предположений о безопасности и границ ошибок при ревью кода ИИ.

Варианты использования

01Стандартизация качества программного обеспечения с помощью строгой автоматизированной оценки и контроля рисков с участием человека.

02Управление реализацией сложных функций, где агенты ИИ выполняют основную часть работы по написанию кода.

03Оптимизация затрат и производительности API за счет сопоставления уровней модели со сложностью задачи.

name

agentic-engineering

description

Operate as an agentic engineer using eval-first execution, decomposition, and cost-aware model routing. Use when AI agents perform most implementation work and humans enforce quality and risk controls.

metadata

origin
ECC

Agentic Engineering

Use this skill for engineering workflows where AI agents perform most implementation work and humans enforce quality and risk controls.

Operating Principles

Define completion criteria before execution.
Decompose work into agent-sized units.
Route model tiers by task complexity.
Measure with evals and regression checks.

Eval-First Loop

Define capability eval and regression eval.
Run baseline and capture failure signatures.
Execute implementation.
Re-run evals and compare deltas.

Example workflow:

1. Write test that captures desired behavior (eval)
2. Run test → capture baseline failures
3. Implement feature
4. Re-run test → verify improvements
5. Check for regressions in other tests

Task Decomposition

Apply the 15-minute unit rule:

Each unit should be independently verifiable
Each unit should have a single dominant risk
Each unit should expose a clear done condition

Good decomposition:

Task: Add user authentication
├─ Unit 1: Add password hashing (15 min, security risk)
├─ Unit 2: Create login endpoint (15 min, API contract risk)
├─ Unit 3: Add session management (15 min, state risk)
└─ Unit 4: Protect routes with middleware (15 min, auth logic risk)

Bad decomposition:

Task: Add user authentication (2 hours, multiple risks)

Model Routing

Choose model tier based on task complexity:

Haiku: Classification, boilerplate transforms, narrow edits
- Example: Rename variable, add type annotation, format code
Sonnet: Implementation and refactors
- Example: Implement feature, refactor module, write tests
Opus: Architecture, root-cause analysis, multi-file invariants
- Example: Design system, debug complex issue, review architecture

Cost discipline: Escalate model tier only when lower tier fails with a clear reasoning gap.

Session Strategy

Continue session for closely-coupled units
- Example: Implementing related functions in same module
Start fresh session after major phase transitions
- Example: Moving from implementation to testing
Compact after milestone completion, not during active debugging
- Example: After feature complete, before starting next feature

Review Focus for AI-Generated Code

Prioritize:

Invariants and edge cases
Error boundaries
Security and auth assumptions
Hidden coupling and rollout risk

Do not waste review cycles on style-only disagreements when automated format/lint already enforce style.

Review checklist:

Edge cases handled (null, empty, boundary values)
Error handling comprehensive
Security assumptions validated
No hidden coupling between modules
Rollout risk assessed (breaking changes, migrations)

Cost Discipline

Track per task:

Model tier used
Token estimate
Retries needed
Wall-clock time
Success/failure outcome

Example tracking:

Task: Implement user login
Model: Sonnet
Tokens: ~5k input, ~2k output
Retries: 1 (initial implementation had auth bug)
Time: 8 minutes
Outcome: Success

When to Use This Skill

Managing AI-driven development workflows
Planning agent task decomposition
Optimizing model tier selection
Implementing eval-first development
Reviewing AI-generated code
Tracking development costs

Integration with Other Skills

tdd-workflow: Combine with eval-first loop for test-driven development
verification-loop: Use for continuous validation during implementation
search-first: Apply before implementation to find existing solutions
coding-standards: Reference during code review phase

Agentic Engineering — что это

Навык Agentic Engineering описывает методологию разработки, в которой AI-агенты выполняют основную часть реализации, а человек фокусируется на контроле качества, управлении рисками и принятии архитектурных решений. Это подход, в котором инженер выступает как «дирижёр»: декомпозирует задачу, задаёт критерии завершения, выбирает подходящую модель и проверяет результат через автоматические тесты (evals).

Как работает

🔁 Eval-First (сначала тест, потом код)

Основной цикл работы строится вокруг автоматических проверок:

Определите eval — тест, который описывает желаемое поведение (например, модульный тест на новую функцию).
Запустите eval на текущем коде — зафиксируйте базовые ошибки (failure signatures).
Реализуйте фичу с помощью AI-агента.
Повторно запустите eval — убедитесь, что поведение исправлено.
Проверьте регрессии — запустите другие тесты, чтобы не сломать существующую логику.

Пример короткого цикла в консоли:

# 1. Написать eval (тест)
pytest tests/test_feature.py -k "new_behavior" --junitxml=baseline.xml

# 2. Запустить AI-агента для реализации
agentic-engineering implement --prompt "add feature X"

# 3. Перезапустить eval и сравнить
pytest tests/test_feature.py -k "new_behavior" --junitxml=result.xml
diff baseline.xml result.xml

📦 Декомпозиция задач (правило 15 минут)

Каждая подзадача должна укладываться в ~15 минут работы агента и соответствовать трём критериям:

✅ Независимо проверяема — можно запустить отдельный eval.
✅ Один доминирующий риск — например, только безопасность или только API-контракт.
✅ Чёткое условие завершения — тест проходит, или код собирается.

Хорошая декомпозиция:

Задача: добавить аутентификацию пользователя
├─ Unit 1: хеширование паролей (15 мин, риск безопасности)
├─ Unit 2: эндпоинт логина (15 мин, риск API-контракта)
├─ Unit 3: управление сессиями (15 мин, риск состояния)
└─ Unit 4: защита роутов middleware (15 мин, риск логики)

Плохая декомпозиция: единая задача на 2 часа со смешанными рисками.

🧠 Маршрутизация моделей по сложности (Model Routing)

Выбор AI-модели в зависимости от задачи:

Уровень	Модель	Тип задач	Пример
🟢 Лёгкий	Haiku	Классификация, шаблонные преобразования, узкие правки	Переименовать переменную, добавить type annotation, отформатировать код
🟡 Средний	Sonnet	Реализация фич, рефакторинг, написание тестов	Реализовать модуль, отрефакторить функцию, написать unit-тесты
🔴 Сложный	Opus	Архитектура, анализ первопричин, многомодульные инварианты	Спроектировать систему, отладить сложный баг, ревью архитектуры

Правило экономии: повышайте уровень модели, только когда более дешёвая не справляется из-за явного пробела в рассуждениях (reasoning gap).

🧩 Стратегия сессий

Продолжать сессию для тесно связанных подзадач (например, несколько функций одного модуля).
Начинать свежую сессию после крупных фазовых переходов (с реализации на тестирование).
Делать compact (сжатие контекста) после достижения milestone, а не во время активной отладки.

👁️ Фокус ревью для AI-сгенерированного кода

Человек проверяет:

Инварианты и граничные случаи — null, пустые списки, граничные значения.
Границы ошибок — правильная обработка исключений.
Безопасность и предположения об аутентификации.
Скрытые связи между модулями (hidden coupling) и риски rollout.

Не тратьте время на стилевые разногласия — если форматирование и линтинг автоматизированы, такие замечания не нужны.

💰 Отслеживание стоимости

Для каждой задачи рекомендуется вести учёт:

Уровень модели.
Примерное количество токенов (input / output).
Количество повторов (retries).
Затраченное время.
Успех / неудача.

Пример записи:

Task: Implement user login
Model: Sonnet
Tokens: ~5k in, ~2k out
Retries: 1 (initial auth bug)
Time: 8 min
Outcome: Success

Когда использовать

Вы управляете AI-driven разработкой в команде.
Нужно спланировать декомпозицию задач для агентов.
Хотите оптимизировать затраты на API моделей.
Внедряете eval-first подход (тесты до кода).
Проводите ревью AI-кода по чеклисту.

Важно знать

Навык хорошо сочетается с другими: tdd-workflow (eval-first + TDD), verification-loop (непрерывная валидация), search-first (поиск существующих решений до реализации), coding-standards (стандарты кодирования на этапе ревью).
Декомпозиция на 15-минутные блоки — не жёсткое правило, а ориентир для оценки agent-sized units.
Маршрутизация моделей — это не догма, а руководство: если Haiku справляется с рефакторингом — используйте её, даже если по таблице рекомендуется Sonnet.

Установите одной командой.

npx skillfish add affaan-m/everything-claude-code agentic-engineering

Источник: https://mcpmarket.com/tools/skills/agentic-engineering-1777849887101

Agentic Engineering

Ключевые возможности

Варианты использования

Agentic Engineering

Operating Principles

Eval-First Loop

Task Decomposition

Model Routing

Session Strategy

Review Focus for AI-Generated Code

Cost Discipline

When to Use This Skill

Integration with Other Skills

Agentic Engineering — что это

Как работает

🔁 Eval-First (сначала тест, потом код)

📦 Декомпозиция задач (правило 15 минут)

🧠 Маршрутизация моделей по сложности (Model Routing)

🧩 Стратегия сессий

👁️ Фокус ревью для AI-сгенерированного кода

💰 Отслеживание стоимости

Когда использовать

Важно знать

Когда стоит начать новую сессию с Claude Code?

Как этот навык помогает оптимизировать затраты на разработку?

Что такое eval-first цикл?

Что такое правило 15-минутного модуля в Agentic Engineering?

Как следует проверять код, сгенерированный ИИ, используя этот навык?

Комментарии