Aimee: ИИ-суфлёр повысил эффективность оператора банка в 6 раз

Этот кейс для меня — один из формирующих. Не потому что в нём самая большая экономия или самая сложная технология. А потому что именно здесь я выработал принцип, который с тех пор повторяю в каждом консалтинговом проекте:

Измерять эффект от внедрения ИИ экономией за счёт сокращения штатных единиц — это тупик. Правильно измерять эффект увеличением прибыли.

Я много раз сталкивался с тем, что организации пытаются оправдать внедрение решения стоимостью в несколько миллионов рублей тем, что сократят нескольких сотрудников с зарплатами от 20 до 60 тысяч. Понятно, что это путь в никуда. Большие решения нужно продавать внутри по-другому. И проект Aimee в контакт-центре Ак Барс Банка стал для меня первым случаем, когда я выстроил эту другую логику от начала до конца — от финансовой модели до защиты на инвестиционном комитете.

Как продавать ИИ внутри: финансовая модель и продуктовая гипотеза

Идея была простая: встроить в чат контакт-центра ИИ-суфлёра — помощника, который в реальном времени предлагает оператору готовые варианты ответа клиенту. Не заменить человека, а усилить его. Оператор видит предложение, выбирает подходящий вариант, при необходимости правит — и отправляет.

Но прежде чем писать код, нужно было обосновать проект внутри организации. Я построил большую финансовую модель, чтобы показать, как данное решение окупится на уровне всей банковской группы. Бизнес-спонсором выступало IT-подразделение, так как внедряемое улучшение касалось всех видов бизнеса группы — розничного, корпоративного, инвестиционного. Решение защищалось на уровне инвестиционного комитета.

Я всегда строю финансовые модели так, чтобы они базировались на продуктовой гипотезе, которая, в свою очередь, задаёт опережающую метрику — такую, которую можно максимально быстро и дёшево получить при помощи минимального эксперимента.

Для нашего случая продуктовая гипотеза звучала так:

Доля символов в ответе оператора, сгенерированных при помощи ИИ, должна быть не менее 35%.

При выполнении этого условия финансовая модель внедрения большого проекта сходилась — не за счёт сокращения сотрудников, а за счёт увеличения пропускной способности контакт-центра и роста удовлетворённости клиентов, которым отвечают до шести раз быстрее и чьи инциденты закрываются в несколько раз оперативнее.

Как мы выстроили эксперимент

После защиты на инвесткомитете мы начали работать над минимальным экспериментом. Не «внедряем на всех», а точечная проверка гипотезы.

Сужение скоупа. Мы выбрали только розничный бизнес. Внутри розничного бизнеса — только пользователей мобильного приложения. Внутри мобильного приложения — уже существующий чат с сотрудниками контакт-центра. В этот чат мы добавили возможность отвечать при помощи ИИ-суфлёра.

Один оператор. Мы открыли функцию ровно на то количество пользователей, которое мог бы обработать один сотрудник контакт-центра. Выделили отдельного оператора, обучили его минимальной реализации системы. По сути, единственная новая функция в дополнение к классическому мессенджеру — это выбор наиболее релевантного ответа из предложенного списка.

Как строились ответы. Ответы формировались на основании эффективных ответов других операторов. Система обладала кратковременной и долговременной памятью. Кратковременная позволяла быстро реагировать на резко возникающие инциденты — например, массовый сбой в мобильном приложении, когда тысячи клиентов одновременно пишут одно и то же. Долговременная — накапливала лучшие практики стандартных ответов на типовые запросы.

Несколько месяцев эксперимента. Мы сознательно не торопились — нужна была статистически достоверная выборка. Как только мы получили статистически значимый результат, пилот был признан успешным, система рекомендована к внедрению.

На шкале автономности процессов это чистый SDP L1 — помощник, который усиливает человека, не заменяя его. Модель не управляет процессом. Финальная ответственность остаётся на операторе.

Работа с сопротивлением

Мы, конечно, сталкивались с определёнными вопросами от рядовых сотрудников — они переживали, что их будут замещать. Но мы сразу дали понять: никого не будем увольнять. Это не дежурное обещание, а осознанная позиция, которая вытекает из финансовой модели: мы обосновывали проект не через сокращение штата, а через рост пропускной способности и удовлетворённости клиентов.

Мы сделали помощника полностью опциональным — оператор мог отклонить предложение одним кликом и написать свой ответ. И мы пригласили операторов в разработку: именно на основании их лучших ответов система обучалась. Операторы стали не объектом автоматизации, а экспертами, чьи знания встроены в систему.

💡 Хотите понять, на каком уровне зрелости находятся ваши процессы? Я провожу 90-минутную Диагностику автономности за 150 000 ₽. Разбираем 3–5 ключевых процессов, находим текущий уровень и следующий шаг. Записаться на диагностику →

Цифры после запуска

После нескольких месяцев эксперимента и получения статистически достоверных результатов мы начали наращивать команду для масштабирования — увеличения скорости разработки автоматизированного рабочего места и интеграции с другими подсистемами банка.

Вот метрики, которые мы зафиксировали.

Эффективность оператора выросла кратно. Та же команда могла теперь обрабатывать в несколько раз больше обращений. Банк выбрал именно этот путь: мы не сокращали людей, а перенаправили часть команды на другие каналы (голосовой, социальные сети, приложение) и начали расти.

AHT сократился с 17:54 до 04:13. Четыре с небольшим минуты вместо восемнадцати — это качественный скачок. Клиент получал ответ до шести раз быстрее. Для клиента это — принципиально другой опыт: ты пишешь в чат и получаешь ответ за минуты, а не через четверть часа.

Пропускная способность чат-канала выросла в шесть раз. Тот же штат операторов в тех же сменах теперь обрабатывал в шесть раз больше диалогов. Чат-канал перестал быть вспомогательным и стал полноценным.

Доля клиентов, решивших вопрос через чат, выросла примерно на 20%. Больше клиентов выбирали чат вместо телефона — потому что стало быстро.

Урок, который я вынес

За эти годы я много раз пересказывал кейс Aimee на консалтинговых сессиях, в программах обучения, в выступлениях. И каждый раз подчёркивал три вещи.

Первое — не продавайте ИИ через сокращение. Если вы обосновываете проект стоимостью в несколько миллионов тем, что уволите трёх сотрудников с зарплатой 40 тысяч, — вы проиграете. Либо проект не защитят, либо защитят и получат саботаж от команды, которая будет знать, что работает «на своё увольнение». Продавайте через рост: больше клиентов обслужено, быстрее ответ, выше удовлетворённость, шире канал.

Второе — стройте финансовую модель на опережающих индикаторах. Не ждите полного внедрения, чтобы узнать, работает ли решение. Сформулируйте продуктовую гипотезу с метрикой, которую можно получить в минимальном эксперименте. Наша гипотеза — «35% символов от ИИ» — позволила за несколько месяцев понять, что модель сходится, и уверенно идти на инвесткомитет.

Третье — AI даёт эффект там, где он встроен в частотный процесс и привязан к конкретной бизнес-метрике. Чат-диалог в контакт-центре повторяется тысячи раз в день, и даже маленькое улучшение одного шага умножается на этот объём. AHT — понятная метрика, которую можно измерить до и после. Без частотности и без метрики проект превращается в «ну мы вроде как стали быстрее».

Эти три принципа я сейчас включаю в AI Leverage Canvas, свой авторский шаблон для приоритизации AI-инициатив. Они — прямое наследие проекта Aimee.

Почему этот кейс остаётся актуальным в 2026 году

Кейсу Aimee много лет. Технологии того времени — это ещё не большие языковые модели. С тех пор многое изменилось: появились GPT-4, появились модели, которые умеют не только предлагать ответы, но и вызывать инструменты, появилась целая шкала уровней автономности. Можно было бы сказать, что сегодня мы бы строили Aimee иначе, на уровне L3 или L4.

Можно. Но не нужно.

Сегодня, в 2026 году, подавляющее большинство банков, с которыми я работаю, всё ещё находятся на том же уровне, на котором Ак Барс Банк был тогда. У них есть ассистенты, у них есть RAG, но они ещё не довели до автоматизации частотные, измеримые процессы в своих контакт-центрах. И моя рекомендация в таких случаях всегда одна и та же: сначала сделайте L1 — помощника оператора, — и только потом думайте про L3 и L4.

Почему? Потому что L1 даёт быстрый результат с минимальными рисками и при этом готовит команду к более высоким уровням. Это та самая быстрая победа, о которой я пишу в статье про дорожную карту внедрения ИИ. Без такой победы на первом горизонте вся дорожная карта превращается в мечты.

Для кого этот кейс

Если вы работаете в банковской риск-функции, в операционных процессах банка, в контакт-центре, в клиентской поддержке любой крупной компании — этот кейс вам показывает, что реально возможно с правильно встроенным помощником. Не «через пять лет», а уже сейчас, с проверенной методикой.

Если вы хотите понять, подходит ли подобный подход для вашей организации, — начните с диагностики автономности ваших процессов.

Обсудить вашу ситуацию →