Почему мы не только консультируем, но и разрабатываем ПО
История о том, как из консалтинга выросли три продукта — panteo.ai для on-premise, TenderScan для закупок и lite.panteo.ai для лид-генерации — и почему я считаю, что эксперт без продукта в 2026 году — это наполовину эксперт.
Почему мы не только консультируем, но и разрабатываем ПО
Когда я рассказываю клиентам, что параллельно с консалтингом мы в команде Panteo.ai разрабатываем три собственных программных продукта, первая реакция почти всегда одинаковая: «зачем?». Консалтинг — это же высокодоходный, масштабируемый бизнес, где продаётся моё время и мой опыт. Продукт — это совсем другая история: нужна разработка, поддержка, продажи, конкуренция с зарубежными гигантами. Зачем мне, который мог бы спокойно делать корпоративные программы обучения за хорошие деньги, впрягаться в продуктовую историю?
Я сам себе этот вопрос задавал несколько раз. И каждый раз приходил к одному и тому же ответу: эксперт без продукта в 2026 году — это наполовину эксперт. И дело не в деньгах. Дело в том, что без живого продукта теряется самое ценное — обратная связь от реальности. Методика, которую я не проверил на своём собственном клиенте своего собственного продукта, остаётся красивой теорией. А теории, которые сделаны без столкновения с реальностью, на практике рассыпаются при первом контакте с живой компанией.
В этой заметке я хочу рассказать, как родились наши три продукта — panteo.ai, TenderScan и lite.panteo.ai — и зачем они существуют. И почему я считаю, что консалтинг плюс продукты вместе сильнее, чем каждое из этих направлений по отдельности.
Треугольник экспертиз — и почему я никогда не бросал код
Чтобы объяснить, как мы пришли к разработке собственных продуктов, мне нужно рассказать о принципе, который я использую в своей работе давно. Я называю его треугольником экспертиз.
У треугольника три вершины: работа с клиентами, развитие собственного бизнеса и образовательная деятельность. Я одновременно делаю все три — и каждая вершина усиливает две другие. Работая с клиентами, я анализирую их бизнес, и это помогает мне улучшать свой. Развивая свой бизнес, я получаю практический опыт, который передаю ученикам на корпоративных программах и в МВА. А образовательная деятельность приводит ко мне свежие идеи, молодых специалистов и новых партнёров — и это снова возвращается в мой бизнес. Убери любую из вершин — остальные две начнут слабеть.
Теперь про код, с которого я когда-то начинал. В первые годы своей карьеры я много писал его руками — это была моя техническая база. Потом, когда меня начали ставить на руководящие позиции, кодинг превратился в эпизодическую практику: демо-прототипы, хакатоны, небольшие инструменты для внутренней работы команды. Основная ответственность уже была другой — продуктовая, стратегическая. Но я никогда не оставлял это хобби полностью: мне было важно не потерять связь с тем, как устроен технический слой внутри любого цифрового продукта. Потому что без этой связи любые консультации начинают звучать как пересказ чужих слайдов.
А потом произошло нечто, что изменило эту историю принципиально. Когда в 2023 году большие языковые модели стали достаточно зрелыми, чтобы на них можно было строить реально работающие прототипы агентов, я понял: расстояние между идеей и рабочим прототипом сократилось в десятки раз. Раньше, чтобы превратить методику в работающий инструмент, нужна была команда разработчиков, три месяца и бюджет. Теперь тот же прототип я могу собрать сам за несколько вечеров — и он работает. Не идеально, но работает достаточно, чтобы клиент мог его попробовать и сказать «да, я это вижу» или «нет, это не то, что нам нужно».
И вот здесь я увидел возможность, которую упускают большинство консультантов. Если я могу сам собрать работающий прототип, зачем продавать клиенту только презентацию? Гораздо честнее принести ему и методику, и прототип, и честное признание того, где прототип ломается. Это превращает консалтинг из «рассказа о том, как правильно» в совместную проверку гипотезы на живом материале.
С тех пор я не возвращаюсь к чистому консалтингу. У меня всегда есть один или несколько параллельных продуктов, которые решают реальные задачи клиентов и одновременно дают мне обратную связь для моих методик. Если я рекомендую клиенту применять RAG в его банке, я это рекомендую не потому, что «прочитал в статье», а потому что сам несколько раз собирал RAG-пайплайны и знаю, где они ломаются. Это и есть то, что я называю практиком, а не наблюдателем.
Тренд, который сильнее всех нас
Я не первый, кто идёт по этому пути. Крупнейшие мировые консалтинговые компании двигаются в ту же сторону уже несколько лет, и тренд усиливается каждый год.
McKinsey ещё в 2015 году купили QuantumBlack — практику продвинутой аналитики и разработки. Сейчас McKinsey QuantumBlack — это несколько тысяч инженеров и data scientists, которые не пишут презентации, а строят работающие системы для клиентов.
BCG в 2022 году запустили BCG X — подразделение, которое занимается именно разработкой и запуском цифровых продуктов, а не традиционным стратегическим консалтингом. BCG X открыто позиционирует себя как «build, not advise» — строим, а не советуем.
Bain & Company пошли ещё дальше и создали Bain Vector Δ — подразделение, которое инвестирует в стартапы и строит собственные продукты рядом с консалтинговой практикой. Плюс Bain Ventures — направление, где консультанты одновременно являются венчурными партнёрами клиентских стартапов.
Deloitte Digital давно делает коммерческое ПО и решения «под ключ», а не только аудит и консалтинг. Accenture Technology по числу разработчиков сравним с крупными IT-компаниями. IBM Consulting — это вообще гибрид, в котором грань между «разработчиком» и «консультантом» стёрлась до неузнаваемости. ThoughtWorks никогда не разделяли дизайн, разработку и консалтинг — они изначально строились как единая практика.
Этот тренд — не про моду. Это про то, что клиенты перестают покупать абстрактные рекомендации и хотят видеть работающий результат. Абстрактная рекомендация легко игнорируется или откладывается на следующий квартал. Рабочий прототип, который уже показывает, что у тебя получится, — совсем другое. Его уже невозможно игнорировать, потому что ты увидел его своими глазами.
И этот тренд будет усиливаться. Я думаю, через три-пять лет граница между консалтингом, образованием, разработкой и внедрением почти исчезнет. Эксперт, который умеет одновременно учить, проектировать и собирать рабочие прототипы — будет востребованнее, чем эксперт, который умеет только рассказывать. Vibe-кодинг, AI-прототипирование и лёгкие инструменты для внедрения делают эту новую модель доступной тем, кому раньше требовалась большая команда.
Именно поэтому я не только консультирую. И именно поэтому я учу других консультантов и клиентов делать то же самое — прямо на своих программах.
Panteo.ai — платформа для суверенного ИИ
Первый и самый большой из наших продуктов — это сама платформа panteo.ai. Это LLM-инфраструктура для развёртывания генеративного ИИ в закрытом контуре компании: on-premise, без передачи данных наружу, с соблюдением требований 152-ФЗ, КИИ и ФСТЭК. Мы называем это «платформой для суверенного ИИ», и это не маркетинговая красивость — это точное техническое описание.
Зачем такая платформа нужна? Потому что в 2026 году у крупных российских банков, государственных структур и корпораций есть совершенно чёткое ограничение: они не могут отправлять чувствительные данные в OpenAI, Anthropic или Google. Это не про недоверие к западным провайдерам (хотя и про это тоже) — это про регуляторные требования, про политику внутренней безопасности, про 152-ФЗ и про то, что клиентские данные банка не имеют права покидать его инфраструктуру. Точка.
Варианты на рынке: российские LLM (GigaChat, YandexGPT, Alice AI) — подходят, но не всегда дают нужное качество для узких бизнес-задач. Open-source модели (Llama, Qwen, Mistral) — качество хорошее, но развёртывание, дообучение, инфраструктура, безопасность — это отдельная дорогостоящая работа. Собственная модель — это вообще отдельный мир, не всем нужен.
Panteo.ai даёт готовую инфраструктуру: платформа разворачивается в контуре клиента, поддерживает работу с несколькими open-source моделями, обеспечивает RAG-поиск по корпоративным документам, контролирует права доступа, логирует все запросы для аудита. Это не «просто LLM», это комплект инструментов для внедрения LLM в закрытую среду. И мы делаем его с 2022 года, начиная с первого прототипа для проекта ЦЕМАК, где требовалось OCR+vLLM в закрытом контуре Администрации Президента.
У нас есть клиенты, которые внедрили panteo.ai в свой контур. Большинство из них я не могу называть публично, потому что это чувствительные государственные и банковские проекты. Но сам факт того, что мы умеем разворачивать и поддерживать такую платформу, — это не теория, а реальная инженерная практика, которую я могу показать любому клиенту, который придёт ко мне на консультацию по теме «нам нужен ИИ в закрытом контуре».
Когда я консультирую банк по внедрению RAG-системы из Уровня 2 шкалы автономности или агента из Уровня 3 (Tool Calling), я не рассказываю абстрактную архитектуру. Я говорю: «Вот так это работает у нас, вот эти грабли мы прошли, вот здесь у нас внутри вот такая штука, которая нужна для того-то». Это — разница между продавцом презентаций и продавцом опыта.
TenderScan — ИИ для закупок
Второй продукт, TenderScan, родился из той самой истории 2023 года, с которой я начал эту заметку. Сейчас это — полноценный SaaS для тендерных отделов компаний, которые участвуют в закупках по 44-ФЗ и 223-ФЗ. Система автоматически подбирает подходящие тендеры, сопоставляет их со складом клиента и готовит коммерческие предложения.
Как работает пайплайн, если коротко:
- Источники. Система подключается к zakupki.gov.ru, Тендерплану, а в планах — к СБИС, Контур.Закупкам и другим. Каждое утро новые закупки автоматически загружаются в контур клиента.
- Извлечение номенклатуры. LLM читает документацию закупки — ТЗ, техзадания, требования — и извлекает структурированный список позиций: что именно заказчику нужно, в каких количествах, с какими характеристиками.
- Сопоставление со складом. Автоматическое сравнение извлечённой номенклатуры со складом поставщика. Умный матчинг по наименованию, артикулу, семантике: «моторное масло 5W-40 синтетика» из закупки → «ГазпромНефть Premium N 5W-40» из склада.
- Оценка маржинальности. Система проверяет, есть ли на складе нужное количество позиций, считает приблизительную маржинальность, помечает закупки «зелёным» (полное совпадение, высокая маржа), «жёлтым» (частичное, требует доработки) и «красным» (не подходит).
- Генерация КП. По подходящим закупкам автоматически готовится черновик коммерческого предложения в фирменном шаблоне клиента, в форматах HTML/PDF/DOCX.
- Доставка. Результат улетает в Битрикс24, Telegram или email в виде готовой карточки с рекомендацией: «вот три тендера на утро, на эти стоит откликаться».
Наш живой кейс — дистрибьютор моторных масел, который продаёт бренды «ГазпромНефть», «Лукойл» и других производителей. Мы подробно разбираем его путь в отдельной статье «Лубрикантс × TenderScan: ИИ для тендерного отдела дистрибьютора». Там же — конкретные цифры, и там я рассказываю честно, чему мы сами научились в этом проекте.
TenderScan пока что мы продаём избирательно — работаем только с теми клиентами, которым нужен именно наш уровень кастомизации и готовности к on-premise-развёртыванию. Массового SaaS-продукта, который можно купить по кредитке без разговора с нами, у нас пока нет, и мы не уверены, что он нужен — потому что клиенты, которым нужен TenderScan, всё равно требуют кастомизации под свои источники, склад и процессы. И именно потому, что мы работаем точечно, каждый кейс даёт нам огромное количество обратной связи, которая потом возвращается в мои консалтинговые проекты.
Lite.panteo.ai — чат-агенты для лид-генерации
Третий продукт, lite.panteo.ai, — это полная противоположность первым двум. Если panteo.ai — это тяжёлая корпоративная платформа, а TenderScan — это узкоспециализированный SaaS для тендерных отделов, то lite.panteo.ai — это лёгкий инструмент для быстрого прототипирования чат-агентов.
Идея простая. В каждой компании, которая что-то продаёт, есть сайт. На сайте есть форма обратной связи. В форму люди пишут одни и те же вопросы: «сколько стоит», «когда будет», «вы можете сделать X», «а у вас есть Y». Штатный менеджер отдела продаж тратит половину своего времени на ответы на эти типовые вопросы. Это ровно та самая ситуация, в которой уровень L1 шкалы автономности процессов — помощник — даёт немедленный эффект.
Lite.panteo.ai позволяет собрать такого помощника за полчаса. Вы заходите на платформу, описываете, для кого агент (онлайн-школа, юридическое бюро, интернет-магазин), загружаете CSV с частыми вопросами и ответами, настраиваете поля для сбора контактов, получаете embed-код и ставите его на свой сайт. Всё. Агент работает.
У сервиса есть простые тарифы — от бесплатного на одного агента со 100 лидами до корпоративного за 30 тысяч рублей в месяц с unlimited-всем. Это намеренно массовый продукт: мы хотим, чтобы маленькие команды могли попробовать ИИ до того, как они придут ко мне за большой корпоративной программой. Это воронка не в смысле «заманивания», а в смысле образовательного моста: человек впервые собрал работающего агента своими руками за тридцать минут, и после этого он приходит ко мне на диагностику уже с другим пониманием того, о чём я говорю.
Для меня lite.panteo.ai — это ещё и лаборатория. Пользователи продукта пишут нам, что у них ломается, что не хватает, какие агенты они пытаются построить. Это поток живой обратной связи от сотен небольших бизнесов, и эта информация потом становится материалом для моих корпоративных программ и кейсов.
Почему три продукта, а не один
Меня иногда спрашивают: почему вы не сфокусируетесь на одном продукте? Делайте TenderScan, это же самое понятное, там ниша, там рынок, там деньги. Забросьте платформу, забросьте lite, сосредоточьтесь.
Ответ у меня на этот вопрос есть, и он — не про «хочу много денег». Он — про то, что три продукта отвечают на три разные сложности рынка, и выбрать один — значит закрыть глаза на две из трёх.
Platform-продукт panteo.ai отвечает на сложность доверия и закрытого контура. Когда крупный банк или государственная структура говорит «нам нужен ИИ, но только в нашем контуре», нельзя ответить «возьмите OpenAI API». Нужна платформа, которая развёртывается в их инфраструктуре, и мы её делаем.
TenderScan отвечает на сложность узких вертикалей. Универсальные ИИ-продукты хороши в горизонтальных задачах (переписка, поиск, анализ текста), но в тендерной работе важна специфика: источники закупок, законодательство, шаблоны КП, интеграция с Битриксом. TenderScan знает эту специфику, универсальная LLM — нет.
Lite.panteo.ai отвечает на сложность порога входа. Большинство небольших бизнесов в России не могут себе позволить ни корпоративную платформу, ни кастомную разработку. Им нужно попробовать «быстро и дёшево», увидеть, работает ли ИИ в их контексте, и только потом принимать большие решения. Lite.panteo.ai — это возможность попробовать.
Эти три сложности не сводятся к одной. И если закрыть два из трёх продуктов, мы станем либо «одной из сотен LLM-платформ», либо «нишевым сервисом для закупщиков», либо «ещё одним конструктором чат-ботов». А сейчас мы — продуктовая компания, которая покрывает три разных слоя спроса и использует обратную связь с каждого слоя для улучшения остальных.
Что это значит для моих клиентов
Когда я прихожу на корпоративную программу в банк, мои клиенты получают не просто методики из презентации. Они получают методики, проверенные в моих собственных продуктах. Когда я рассказываю про Уровень 2 RAG на шкале автономности, я не пересказываю статью из интернета — я рассказываю, как мы сами строили RAG в panteo.ai для закрытого контура, какие грабли мы там прошли, как справлялись с многоязычностью, с обновлением индексов, с правами доступа.
Когда я говорю про Уровень 4 — автономных агентов, я показываю TenderScan как живой пример агента, который планирует, исполняет, проверяет и доставляет результат без участия человека на каждом шаге. Это не слайды, это работающий продукт с реальными клиентами.
Когда я провожу фасилитационную сессию AI Café на 100+ участников, я использую собственную платформу offsite.panteo.ai, которую мы построили специально под эту задачу. И я знаю все её ограничения, потому что я каждое из них вместе с командой лечил.
Это даёт клиентам две вещи, которых не даёт «чистый консалтинг».
Первое — уверенность. Мои рекомендации — это не теория и не «вот так обычно делают». Это «вот так мы делаем у себя, и вот что получилось». Клиент может приехать к нам, посмотреть на действующие инсталляции, поговорить с командой, которая их эксплуатирует, — и убедиться, что мы сами используем то, что рекомендуем.
Второе — путь до прода. Консалтинг без продукта часто заканчивается на рекомендации: «вам нужна RAG-система, внедряйте». Что дальше — проблема клиента. Я вместо этого могу сказать: «вам нужна RAG-система, вот платформа, которая у нас уже есть, мы развернём её в вашем контуре за две недели, дальше пойдёт кастомизация». Это — переход от теории к результату, и именно этого чаще всего не хватает рынку корпоративного AI.
Для кого это интересно
Если вы руководитель в банке, государственной структуре или корпорации, который задумывается о внедрении ИИ, — у нас есть три разных способа поработать вместе, в зависимости от стадии, на которой вы находитесь.
Если вам нужно понять, с чего начать, вам подойдёт 90-минутная Диагностика автономности. На выходе — карта зрелости ваших процессов и три приоритизированные инициативы. Это не продажа моего продукта, это диагностика вашей ситуации.
Если вам нужна большая программа обучения команды, у меня есть интенсивы для продуктовых команд корпорации и для госсектора. Каждый интенсив построен на методиках, проверенных в моих собственных продуктах.
Если вам нужна платформа для развёртывания ИИ в закрытом контуре, мы разговариваем про panteo.ai как часть комплексного внедрения. Это не коробочное решение, это всегда проект под конкретного клиента.
Если вам нужен быстрый ИИ-агент для лидогенерации, зайдите на lite.panteo.ai, попробуйте бесплатный тариф, соберите первого агента за 30 минут.
Если вы дистрибьютор или поставщик и хотите автоматизировать тендерную работу, зайдите на tenderscan.panteo.ai или напишите мне — мы обсудим формат пилотного внедрения.
Во всех случаях следующий шаг — один разговор. Без давления и без «запишитесь сейчас, осталось три места». Просто разговор, после которого станет понятно, есть ли смысл двигаться дальше.
Обсудить в вашем контексте
Начните с 90-минутной Диагностики автономности. На выходе — карта зрелости ваших процессов и 3 приоритизированные инициативы.
Записаться на диагностику →