01Исследования
Автор
Инженерия Creative Ventures
Опубликовано
Время чтения
9 мин чтения

Как оценивать AI-фичи: практический фреймворк для продуктовых команд

Оценка AI-фич сложнее, чем CRUD-сайзинг — happy path врёт. Трёхосевой фреймворк для скоупинга AI: допустимая точность, восстановимость и экспозиция данных.

Фреймворк оценки AI-фич — трёхосевая матрица риска

Оценка CRUD-фичи — это привычка. Оценка AI-фичи — это спор. Модель работает в демо, падает 8% в реальном использовании, и эти 8% — ровно там, где живут ваши пользователи. Вот фреймворк, который мы сейчас применяем перед тем, как назвать клиенту число.

Три оси оценки AI-фич

Каждую AI-фичу в сайзинге мы кладём на три оси. Допустимая точность — насколько неправильным может быть вывод, пока пользователю всё равно. Восстановимость — если модель ошиблась, сколько стоит восстановление. Экспозиция данных — что модель должна увидеть, и каков blast radius при утечке.

Трёхосевая матрица оценки AI-фичи
Каждая AI-фича попадает на трёхосевую матрицу ещё до получения числа.

Что мы неправильно делали в AI-оценке

Наш первый год AI-оценок был по сути софт-оценкой плюс fudge-коэффициент. Скоупили happy path, умножали на 1.5 — и всё. Стабильно упускали eval-харнесс, fallback UI и human-in-the-loop. Ни одно из этого не опционально в проде; всё это невидимо в демо.

Стоимость AI-фичи = стоимость happy path × стоимость recovery path.
Внутренняя инженерная записка

Одна страница, которую мы заполняем на каждую AI-фичу

Каждая новая AI-фича — один документ. Определение задачи в один абзац. Пол точности одним числом. Fallback UI двумя скетчами. Human-in-the-loop путь — диаграммой. Data footprint — списком пунктов. Если хоть одно из этих пяти замахнули рукой — фича не готова к оценке.

Один лист оценки AI-фичи
Один лист, который каждая AI-фича заполняет до цифры.
02ЕЩЁ ИЗ СТУДИИ

Ещё кейсы с нашей полки.

Та же команда — другие задачи. Свежие проекты в смежных индустриях — каждый вели те же сеньоры, что отвечают за результат.

03ЧТО ГОВОРЯТ КЛИЕНТЫ

Слова тех, кто уже запустился.

Настоящие отзывы — от тех, кому свой продукт важен. Фаундеры, CTO и продакты, с которыми мы вместе делали запуски. Без подобранных цитат.

ЧТО ОНИ ГОВОРЯТ/01

· Parsewise®

Перестроили всю платформу за 4 месяца. Скорость выросла в 3 раза, а наша команда наконец-то может поддерживать код сама.

Алексей
АлексейCTO · Parsewise
ЧТО ОНИ ГОВОРЯТ/02

· Wishboard®

С нуля до 50k пользователей за полгода. Команда взяла на себя дизайн, код и запуск — мы спокойно занимались продуктом.

Марина
МаринаФаундер · Trywishboard
ЧТО ОНИ ГОВОРЯТ/03

· RLC®

Нам срочно нужны были пять сеньоров. Встроились в команду, переняли наши стандарты и катили фичи рядом с нашими разработчиками.

Дмитрий
ДмитрийVP Engineering · RLC
ЧТО ОНИ ГОВОРЯТ/04

· Blured®

AI-агент, которого они собрали, закрывает 70% обращений в поддержку. Ответы теперь за секунды, а не за часы.

Катя
КатяProduct Lead · Blured
04ЧАСТЫЕ ВОПРОСЫ

Что нас обычно спрашивают перед стартом.

Начинаем с изучения задачи. Говорим с вами, смотрим, что уже есть, изучаем конкурентов. Получаете подробный план до того, как мы напишем первую строку кода.

МАНИФЕСТ

Спринты по две недели. Сеньоры с первого дня. Код доходит до прода. Продукт, которым реально пользуются. Команда остаётся до запуска.