Шкала автономности процессов: как измерить ИИ-зрелость
Авторская шкала из 6 уровней зрелости внедрения ИИ — от скриптов и RPA до самоуправляемого бизнеса. Параллель с автомобильной автономностью, которую легко понять совету директоров.
Шкала автономности процессов: как измерить ИИ-зрелость компании
Первый раз шкала по-настоящему заработала — не на слайде, а в живой сессии — когда один крупный международный банк заказал у меня фасилитацию ИИ-стратсессии для своей риск-функции. Сто с лишним специалистов в зале и онлайн, шесть функциональных направлений, задача — за один день получить дорожную карту внедрения ИИ.
Я построил всё мероприятие вокруг шести уровней зрелости. Этот подход перекликается с идеей Self-Driving Bank, которую к тому моменту уже обсуждали несколько крупных игроков, — но я применил его не абстрактно, а как рабочий инструмент фасилитации. Каждое функциональное подразделение смотрело на свои процессы через шкалу: на каком уровне находится каждый процесс или подпроцесс прямо сейчас? Участники определяли текущий уровень, а затем генерировали идеи того, как перейти на следующий.
Вторым элементом был ИИ-фасилитатор offsite.panteo.ai — платформа, которую я разработал специально для таких сессий. Фасилитатор на базе искусственного интеллекта в реальном времени фиксировал идеи со столов, обобщал, группировал по темам и выставлял на голосование — чтобы быстро отобрать лучшие инициативы из сотен предложений. Без этой платформы один ведущий не смог бы обработать такой объём идей от шести параллельных групп.
К концу дня у банка была приоритизированная дорожная карта из инициатив по внедрению ИИ и повышению зрелости процессов — построенная не «сверху», а самими командами, которые будут эти инициативы реализовывать. Полный разбор того, как прошёл этот день, — в отдельном кейсе.
С тех пор я не провожу стратегические сессии без этой шкалы. Я называю её шкалой автономности процессов, в технических документах использую аббревиатуру SDP — Self-Driving Process, — но на русском языке правильное и точное название у неё одно. Если вы пришли сюда в поиске шкалы зрелости ИИ или любого другого фреймворка для оценки того, «на каком этапе мы находимся», — это она. Только я не пересказываю чужой фреймворк. Я делюсь тем, которым сам пользуюсь с банками, госструктурами и корпорациями.
Зачем вообще нужна шкала
Главная проблема разговора про ИИ в крупных организациях — не в том, что идей мало. Проблема в том, что у команды нет общего языка. Для архитектора «внедрение ИИ» — это выбор модели, построение пайплайна, метрика точности. Для бизнес-заказчика — это «кнопка, которая делает хорошо». Для комплаенса — это риск, который нельзя пропустить. Для HR — вопрос о людях. Все говорят одно и то же слово — и имеют в виду совершенно разные вещи.
Шкала зрелости ИИ-процесса даёт всем участникам общий язык. Разговор становится конкретнее: «сейчас этот процесс на уровне SDP L1, мы хотим на L2, для этого нужны такие-то данные и такие-то контроли». Это меняет динамику встречи. Люди начинают договариваться, а не спорить о модных терминах. Это — не теория. Я видел, как встречи длиной четыре часа сокращаются до полутора, когда команда обучается говорить на языке шкалы.
Второе, что даёт шкала, — это защита от переоценки. Большинство провалов корпоративного AI в 2026 году — это попытка прыгнуть через уровни. Gartner в отчёте 2026 года пишет: 72% компаний пилотят AI, только 11% доводят пилоты до продакшна. Моё объяснение простое: компании пытаются прыгнуть с L0 сразу на L4, минуя L1–L3. Автономный агент на компании, у которой нет культуры работы с данными, — это не автоматизация, это просто усиление хаоса. Шкала не даёт сделать этот прыжок, потому что каждый следующий уровень требует выполнения условий предыдущего.
И третье, что особенно важно, — шкала не про технологию, а про процесс. Это разворот, который многим даётся не сразу. Можно внедрить одну и ту же LLM-модель в пять разных процессов и получить пять разных уровней зрелости, потому что везде будет разная роль человека, разная цена ошибки, разные данные. «Мы на уровне L2, потому что у нас есть GPT» — это неправда. Правильно — «этот конкретный процесс находится на уровне L2 в том виде, как он встроен в нашу работу».
Параллель, которая помогает понять всё сразу
Когда я впервые собирал шкалу, я долго искал метафору, которую можно показать совету директоров за 30 секунд. И нашёл её там, где не ожидал — в автомобильной индустрии. Классификация автомобильной автономности SAE J3016 устроена ровно так же: шесть уровней, от L0 до L5, и каждый уровень отвечает на вопрос «кто управляет — человек или система».
Вот как эти две шкалы ложатся одна на другую:
| Уровень | Автомобили (SAE J3016) | ИИ-процессы (SDP) |
|---|---|---|
| L0 | Без автоматизации — водитель управляет всем | Автоматизация ручного труда: Excel-макросы, RPA, скрипты |
| L1 | Подсказка водителю — адаптивный круиз-контроль, удержание в полосе | GPT-ассистенты: помощник пишет черновики, отвечает на вопросы |
| L2 | Частичная автоматизация — машина ведёт себя в полосе, но водитель следит | RAG-системы: LLM + корпоративная база знаний |
| L3 | Условная автоматизация — машина ведёт в определённых условиях, водитель готов взять контроль | Tool Calling / MCP: агент вызывает API, базы, BI-системы |
| L4 | Высокая автоматизация — машина полностью ведёт в определённом ODD, водитель не нужен | Автономные агенты: планируют и выполняют цепочки действий |
| L5 | Полная автоматизация — машина ведёт в любых условиях | Self-Driving Business: весь бизнес-процесс выполняется автономно |
Параллель не случайна. И автомобиль, и ИИ-процесс — это ответ на один и тот же вопрос: как передать рутинную работу машине, сохранив при этом безопасность и контроль. Отсюда и одинаковая логика уровней.
У этой параллели есть важное методологическое последствие. Когда я объясняю CDO банка, что мы сейчас на SDP L2 и хотим перейти на L3, я могу сказать: «это как перейти с адаптивного круиз-контроля на автопилот в пробке — система становится способна вызывать инструменты сама, но под постоянным контролем водителя». И руководитель, который ни разу не читал про MCP и Tool Calling, сразу понимает, о чём разговор. Это экономит часы объяснений.
Ещё одно следствие. В автомобильной индустрии переход между уровнями занимает годы, а не месяцы — и это нормально. Tesla продвигалась от L2 к L3 с 2014 по 2024 год. Если кто-то приходит ко мне с просьбой «за три месяца провести нас от L1 до L4», я достаю эту параллель и спрашиваю: «Вы бы сели в машину, которую за три месяца переделали с круиз-контроля на полный автопилот?». Обычно этого достаточно, чтобы перевести разговор в реалистичный темп.
Шесть уровней: что стоит за каждым
Давайте пройдёмся по уровням подробно. Я сделаю это в том же виде, в каком обычно показываю на сессиях: короткая таблица-справочник, а потом — рассказ с примерами и деталями.
| Уровень | Название | Роль человека | Что делают инструменты | Примеры |
|---|---|---|---|---|
| L0 | Автоматизация ручного труда | Выполняет процесс, инструменты ускоряют отдельные действия | Скрипты, макросы, RPA автоматизируют повторяющиеся задачи | Excel-макросы, роботы для выгрузки отчётов, автозаполнение форм |
| L1 | GPT-ассистенты | Выполняет процесс, получает подсказки и текстовую поддержку | Модели генерируют тексты, ответы, помогают формулировать решения | ChatGPT для черновиков, внутренний ассистент для ответов на вопросы сотрудников |
| L2 | RAG — документный интеллект | Остаётся ответственным за решения, получает релевантную информацию быстрее | Система комбинирует LLM с корпоративной базой знаний, возвращает точные ответы и выдержки | Поиск по резюме кандидатов, интеллектуальный поиск по нормативной документации |
| L3 | Tool Calling / MCP | Инициирует процесс, ИИ выполняет действия в инструментах | Ассистент не только советует, но и вызывает API, БД, BI-системы, через MCP подключает внутренние сервисы | Виртуальный помощник топ-менеджера для генерации отчётов и анализа BI-данных |
| L4 | Автономные агенты | Ставит цель, агент самостоятельно достигает её в рамках ограниченных условий | Автономные агенты планируют и исполняют цепочки действий (planning, Schema-Guided Reasoning) | Автоматическая валидация закупочной документации, подготовка КП без ручной доработки |
| L5 | Self-Driving Business | Не участвует в процессе, контролирует только результат | Полностью автономное выполнение бизнес-процессов от запроса до результата | End-to-end цифровая закупка: от ТЗ → поиск поставщиков → проверка → договор → закрывающие документы |
А теперь — по одному уровню с деталями.
L0 — Автоматизация ручного труда
На L0 ИИ в привычном смысле ещё нет. Есть скрипты, макросы, RPA. Человек выполняет процесс, а инструменты только ускоряют отдельные шаги. Excel-макрос, который агрегирует отчёт, — это L0. Робот, который каждое утро скачивает курсы валют из семи банков и складывает в одну таблицу, — это L0. Автозаполнение формы по шаблону — тоже L0.
Этот уровень часто недооценивают. «Мы хотим сразу GPT, зачем нам RPA». Но я видел десятки компаний, которые пытались запустить L3 или L4, не дисциплинировав L0. Результат один и тот же: проект зависает на этапе «собрать данные для обучения», потому что данные живут в пяти разных системах, и никто не знает, как их склеить. Компания, которая не научилась автоматизировать выгрузку отчёта, не готова к автономному агенту.
На L0 организация приобретает главный навык, без которого дальше двигаться нельзя: дисциплину измерения эффекта. Сколько было ручных действий до? Сколько после? Какая экономия в часах или рублях? Без этой школы любая последующая LLM-инициатива будет висеть в воздухе. Её просто нельзя будет защитить перед финансистом.
L1 — GPT-ассистенты
L1 — это первый уровень, на котором появляются большие языковые модели. Главная характеристика: модель помогает человеку, но не управляет процессом. Черновик письма, выжимка из документа, первичный разбор обращения, подготовка аналитической записки. Всё остаётся под контролем сотрудника — модель только ускоряет.
Мой самый часто цитируемый кейс L1 — это внедрение ИИ-суфлёра Aimee в контакт-центр Ак Барс Банка. Суфлёр в реальном времени предлагал оператору готовые варианты ответа клиенту — на основании эффективных ответов других операторов. Сотрудник выбирал подходящий вариант, при необходимости правил и отправлял. Результат: пропускная способность чат-канала выросла в шесть раз, AHT сократился с 17:54 до 04:13.
Но самое интересное в этом проекте — не цифры, а подход. Мы не обосновывали проект сокращением штата. Мы построили финансовую модель, основанную на опережающем индикаторе — продуктовой гипотезе «не менее 35% символов в ответе оператора генерируются ИИ». Защитили на инвесткомитете. Провели минимальный эксперимент на одном операторе в розничном канале. И только после статистически достоверного результата пошли масштабировать. Именно такая дисциплина делает L1 работающим уровнем, а не экспериментом в вакууме.
На L1 впервые появляется разговор о человеке в контуре. Кто принимает финальное решение? Кто отвечает за ошибку? Эти вопросы будут повторяться на всех следующих уровнях. Но задаются они здесь — и те, кто не отвечает на них на L1, застревают в этом уровне навсегда.
L2 — RAG и документный интеллект
На L2 модель перестаёт отвечать «из своей головы». Она сначала ищет нужные фрагменты во внутреннем корпусе знаний — базе регламентов, документации, кейсов, — а затем строит ответ с опорой на найденные источники. Это называется RAG, Retrieval-Augmented Generation.
L2 — это место, где внедрение ИИ перестаёт быть игрушкой для энтузиастов и становится корпоративной инфраструктурой. Потому что RAG требует порядка в данных: актуальность документов, единый источник правды, версионирование, права доступа. Банк, который запускает RAG-помощника по внутренним регламентам, впервые честно сталкивается с вопросом: а у нас есть единая актуальная база этих регламентов? В 80 процентах случаев ответ — «формально есть, реально — нет, один и тот же регламент в трёх разных версиях в трёх разных папках».
Именно здесь, на L2, возникает практика трассируемости: каждый ответ модели должен сопровождаться ссылкой на источник. Это то, что в моих проектах для госсектора — через Panteo.ai и ЦЕМАК — было ключевым требованием. OCR с vLLM-извлечением реквизитов, подсветка конкретного фрагмента исходного документа, привязка к странице оригинала, подготовка для 1С:Документооборот. Без трассируемости L2 не проходит внутренний аудит.
💡 Хотите понять, на каком уровне шкалы сейчас находятся ваши процессы? Я провожу 90-минутную Диагностику автономности за 150 000 ₽. Мы разбираем 3–5 ваших ключевых процессов и по каждому находим текущий уровень и следующий шаг. На выходе — карта зрелости и три приоритизированные инициативы. Записаться на диагностику →
L3 — Tool Calling и MCP
На L3 модель получает право действовать, а не только отвечать. Она вызывает функции, корпоративные сервисы, базы данных, системы задач, календари. Классический пример — интеграция через Model Context Protocol (MCP), когда агент получает доступ к ограниченному набору корпоративных инструментов и выполняет в них действия под контролем политики безопасности.
Пример из банковской практики: виртуальный помощник топ-менеджера. Руководитель пишет в чат «покажи мне динамику просрочки по корпоративному портфелю за последний квартал» — ассистент идёт в BI-систему, формирует запрос, получает данные, строит график, возвращает ответ. Это уже не L2, потому что ассистент не ищет в документах, а вызывает инструмент и получает результат. Это совершенно другая архитектура и совершенно другие требования к безопасности.
L3 — самый сложный в управлении уровень из всех. Потому что от модели теперь зависит состояние корпоративной системы, а не только черновик письма. Здесь особенно важны контроль прав, наблюдаемость, откат действий и версионирование промптов. В моих проектах для риск-функции банков именно L3 требует самой тщательной проработки MRM-контура — и именно про это я пишу в отдельной заметке «MRM для GenAI: что не работает и что с этим делать».
L4 — Автономные агенты
На L4 система уже не просто вызывает инструменты по команде, а сама планирует последовательность шагов, выполняет их, проверяет промежуточный результат, перепланирует маршрут и доводит работу до завершения. Человек ставит цель — агент достигает её. В рамках ограничений, заданных политикой.
Самый живой пример L4, который я видел своими глазами, — это TenderScan в работе у дистрибьютора масел «Лубрикантс». Дистрибьютор продаёт моторные масла брендов «ГазпромНефть», «Лукойл», Shell — и каждое утро тендерный специалист должен был вручную просматривать госзакупки, искать подходящие лоты, сверять их с текущим складом, готовить коммерческие предложения. Это три-четыре часа работы в день, и половина этого времени уходила не на решение, а на перекладывание данных.
Мы поставили TenderScan, настроили коннектор к zakupki.gov.ru и Тендерплану, загрузили склад с 250+ номенклатурных позиций. Дальше система начала работать сама: утром забирала новые закупки, автоматически извлекала номенклатуру из документации, сверяла со складом, помечала те, по которым дистрибьютор может закрыть позицию полностью, подготавливала черновик коммерческого предложения и отправляла в Telegram ответственному. Тендерный специалист утром получал пять готовых карточек и принимал финальное решение — на какие откликаться. Это L4: человек ставит цель (находить тендеры на наш склад), агент её достигает.
L5 — Self-Driving Business
L5 — это когда система выполняет бизнес-процесс от запроса до результата без участия человека. Человек только контролирует результат. Это уровень, на котором один процесс превращается в полностью цифровой поток: вход — запрос, выход — готовый артефакт. В примере с закупками это выглядит так: end-to-end цифровая закупка от ТЗ через поиск поставщиков и проверку до договора и закрывающих документов, без единого ручного шага.
L5 — это не фантазия. Это уровень, на котором сегодня работают некоторые специализированные участки у лидеров рынка. Но как состояние целой компании — L5 пока что разговор о будущем, а не о настоящем. Я не видел ни одной организации, которая могла бы честно сказать: «мы на L5». В этом нет ничего страшного. Цель шкалы — не ставить галочку на верхней ступени, а понимать свой следующий шаг.
Этот уровень я назвал самоуправляемым бизнесом. Это же название я дал своей третьей книге, которая выходит в декабре 2026 года в крупнейшем издательстве РФ. В книге — полное описание всех шести уровней, диагностические вопросы для каждого, примеры прогрессии одной компании от L0 до L5, список применимых технологий и разбор ошибок. Но книга не нужна, чтобы начать. Методика работает сразу, и применить её к своим процессам можно прямо сейчас.
Как определить ваш текущий уровень за 90 минут
Когда я прихожу к клиенту на Диагностику автономности — это и есть, по сути, быстрый способ применить шкалу. За полтора часа мы проходим по трём-пяти ключевым процессам и по каждому отвечаем на четыре вопроса. Эти четыре вопроса — основа всей методики, и их можно использовать самостоятельно.
Первый вопрос — что именно болит? Поиск, понимание, проверка, принятие решения или исполнение действия? Если болит поиск — вам, скорее всего, нужен RAG (L2). Если болит исполнение рутинных действий — инструментальный агент (L3). Если болит первичная обработка больших объёмов текста — помощник (L1). Если болит распознавание, классификация, прогнозирование — классические модели или RPA (L0). Если болит сразу всё — процесс ещё не разложен на составляющие, и начинать надо с декомпозиции.
Второй вопрос — какие данные и документы уже существуют, и можно ли им доверять? На каждом следующем уровне требования к качеству данных растут. Помощник на L1 может работать на среднем качестве. RAG на L2 требует единого источника правды. Tool Calling на L3 требует строгого контроля версий и прав. Автономные агенты на L4 требуют наблюдаемого цифрового следа всех операций. Честный ответ на этот вопрос часто снижает амбиции на один уровень вниз — и это полезно.
Третий вопрос — где находится человек? До ответа, после ответа или в каждой критической точке? Эта формулировка — из моей практики банковских фасилитаций. «До ответа» — человек формулирует задачу, модель готовит материал, финал за сотрудником. «После ответа» — модель делает, человек проверяет. «В каждой критической точке» — гибрид. Ответ показывает, насколько уровень автономности соответствует комплаенс-требованиям процесса.
Четвёртый вопрос — по какому признаку будет видно, что процесс стал лучше? Быстрее, дешевле, точнее или прозрачнее? Без ответа на этот вопрос не стоит запускать никакое внедрение, потому что вы не сможете показать результат финансисту. Метрика должна быть сформулирована до старта пилота, а не после.
Четыре вопроса, применённые к 3–5 процессам за полтора часа, дают карту зрелости организации: что на каком уровне, где разрывы, что логично делать следующим шагом. Обычно на такой сессии выясняется, что два-три процесса готовы к переходу на следующий уровень прямо сейчас, а один — требует работы с данными и не должен трогаться ещё полгода.
Частые ошибки — те, которые я вижу чаще всего
За несколько лет работы со шкалой у меня накопился узнаваемый список ошибок. Они повторяются примерно в каждой второй компании, с которой я начинаю работать.
Ошибка первая — путать уровень с технологией. «У нас внедрён GPT, значит мы на L2». Нет. Уровень зависит от того, как GPT встроен в процесс, а не от самого факта использования. Можно использовать одну и ту же модель как продвинутый помощник (L1), как RAG-систему (L2) или как инструментального агента (L3) — это три разные зрелости при одной и той же технологии.
Ошибка вторая — требовать L4 в первом пилоте. «Давайте сразу автономный агент, зачем нам мелочиться». Через два месяца проект мертвеет, потому что процесс не готов, данные не готовы, комплаенс не готов, метрика не определена. Правильный заход — всегда на один уровень выше текущего, не дальше.
Ошибка третья — игнорировать L0. «Классика — это прошлый век, давайте сразу LLM». В реальности L0 решает многие задачи лучше и дешевле. Каска на стройплощадке, сверка документов с шаблоном, классификация входящих обращений — это всё задачи, где LLM избыточна, а классическая модель работает быстрее, дешевле и точнее.
Ошибка четвёртая — считать, что шкала линейна. На практике организация одновременно находится на L1 в одном процессе, на L3 — в другом, и на L0 — в третьем. Это нормально. Цель не в том, чтобы «перевести всю компанию на L5», а в том, чтобы каждому процессу подобрать подходящий уровень с учётом данных, рисков и метрик.
Ошибка пятая — забыть про человека в контуре. Чем выше уровень, тем меньше вмешательство человека — но никогда не до нуля. Даже на L5 остаются контрольные точки, где решение принимает человек. Компании, которые убирают человека полностью, получают не автоматизацию, а неуправляемость.
Где шкала работает в моих программах
Шкала — сквозной инструмент во всех моих проектах. В банковском секторе я использую её как базу для программ обучения риск-команд: каждый модуль привязан к одному из уровней, и к концу программы команда имеет общую карту своих процессов. В фасилитации для риск-команды одного международного банка шкала структурировала шесть параллельных обсуждений в один день: каждый стол работал со своей темой, но в конце все карты сошлись на одной шкале.
В госсекторе шкала — основа программы, которую я проводил для АО «Корпорация развития Дальнего Востока и Арктики». В финальном модуле программы четыре команды защищали свои дорожные карты внедрения ИИ — и каждая карта строилась как последовательность шагов по шкале: где мы сейчас, куда хотим, что именно сделать. Разбор этого кейса и благодарственное письмо от Министерства РФ по развитию Дальнего Востока — в статье «КРДВ: ИИ-обучение для госсектора».
Связанные методики — это инструменты, которые работают поверх шкалы: AI Leverage Canvas помогает выбрать, где в пределах одного уровня сделать первый шаг; дорожная карта внедрения ИИ — это артефакт, который получается в конце сессии; AI Café — формат фасилитации, в котором шкала структурирует групповое обсуждение; Gen BI Maturity Index — параллельная шкала для отдельного направления генеративной аналитики.
Все эти инструменты — части одной системы, но каждый из них можно применять и отдельно. Шкала автономности — это центральная ось, к которой всё остальное крепится.
Что делать дальше
Если вы дочитали до этого места, у вас, скорее всего, одна из двух ситуаций.
Первая — вы уже пробовали внедрять ИИ, и где-то застряли. Пилот не вышел в прод, комплаенс блокирует, команда не договаривается. В этом случае имеет смысл начать с быстрой Диагностики. За полтора часа мы по шкале определим, где именно ваши процессы и почему они застряли. На выходе — карта зрелости и три приоритизированные инициативы для перехода на следующий уровень. Без продающих презентаций, без «мы всё сделаем». Просто карта и три шага.
Вторая — у вас ещё не было опыта внедрения, но понимаете, что пора начинать, и хочется сразу сделать правильно. Здесь я предлагаю однодневный Audit зрелости — глубже, чем диагностика, с полным разбором и дорожной картой на 3/6/9/12 месяцев вперёд.
В обоих случаях следующий шаг — один звонок, после которого станет понятно, как двигаться дальше.
Частые вопросы
Почему вы выбрали именно шесть уровней, а не пять или семь?
Чем Шкала автономности процессов отличается от CMMI?
На каком уровне шкалы находится большинство российских банков?
Можно ли прыгнуть через уровни?
Шкала — это только про большие языковые модели?
Как применить шкалу к своим процессам за один вечер?
Где можно прочитать полное описание шкалы?
Обсудить в вашем контексте
Начните с 90-минутной Диагностики автономности. На выходе — карта зрелости ваших процессов и 3 приоритизированные инициативы.
Записаться на диагностику →