Как собрать ИИ-ассистента без программиста: кубики данных вместо тысяч строк кода

Как устроены современные no-code системы для бизнес-аналитики? Насколько автономными от человека и «умными» могут быть такие информационные системы? Можно ли пользоваться ими, ничего не понимая в программировании? Об этом «Науке Mail.ru» рассказал эксперт — разработчик подобных систем.
Ольга Ведерникова
Об эксперте: Ольга Ведерникова — выпускник МИФИ, инициатор проекта Epsilon Workspace (Университетский технологический акселератор МИФИ и «Росатома»).

Как должен выглядеть современный бизнес-ассистент

Я всю жизнь проработала в IT- и Data Science-подразделениях разных корпораций, все время сталкиваясь с задачами, внутри которых обязательно была часть, связанная с анализом данных. Сначала это были обычные данные и реляционные модели, чему меня учили в институте. Затем стали появляться большие данные и задачки по их обработке, анализу и предиктивной аналитике. У меня появилось понимание, какие продукты и инструменты нужны для того, чтобы собирать и обрабатывать большие объемы данных.

Возможности современных ИИ-ассистентов по обработке больших объемов данных стремительно увеличиваются
Возможности современных ИИ-ассистентов по обработке больших объемов данных стремительно увеличиваютсяИсточник: Freepik

А дальше появились технологии, связанные с искусственным интеллектом, и благодаря им стало возможным собирать, обрабатывать и анализировать большие данные без программистов.

Я уверена: современный продукт для бизнеса по обработке данных должен выглядеть для пользователя как совокупность визуальных элементов, каждый из которых отвечает за ту или иную операцию над данными, например, объединение, фильтрация, сортировка, извлечение, удаление дубликатов и так далее, начиная с самых таких простых операций и заканчивая довольно сложными, как, например, модели машинного обучения, которые могут на основании этих данных сделать прогноз или какие-то выводы, или даже дать рекомендацию. И все задачи по анализу данных решаются через выстраивание визуальных элементов, то есть вы просто «дергаете» курсором разные кубики на экране, связываете их между собой и на каждом этапе видите промежуточный результат.

Из этих «кубиков» можно конструировать ИИ-агентов, ассистентов, помогающих в бизнесе. Очень важно, что это Noode системы, то есть не требующие знания кодинга и программирования.

Агенты бывают разные

Уже определились типовые роли ИИ-агентов.

Первый тип — это агенты, которые очень хорошо умеют работать с неструктурированной информацией, например, в разбросанных по разным местам документам, многостраничных таблицам, диаграммам и так далее. То есть они умеют проанализировать документ и вытащить из него все самое ценное. Новые поколения информационных систем имеют преимущества перед решениями предыдущих лет, которые, как правило, не умеют работать с таблицами и диаграммами, очень плохо понимают, что там написано, что к чему относится, особенно если диаграммы еще разных цветов.

No-Сode
ИИ-агентов можно конструировать с помощью No-Сode систем, не требующих знаний кодинга и программированияИсточник: Soupstock

Решения новых поколений могут понять диаграмму, даже если на ней нет подписи данных, и где-то внизу есть легенда, а смысл столбцов диаграммы надо понимать по их цвету. Современные большие визуальные модели — visual models — в состоянии все это делать.

Это очень часто востребовано со стороны компаний, у которых много инженерно-технической документации, а также у аудиторов и консультантов, которые вынуждены работать с большим количеством разных неструктурированных и сложных документов.

Агенты второго типа могут распознать документ и понять, в какие таблички извлеченные данные надо разложить, чтобы с ними можно было потом работать, и потом на основании их сделать уже какую-то рекомендацию или провести анализ. То есть такой агент не просто вытаскивает что-то из PDF-файлов, он еще это все раскладывает по нужным местам и дает на выходе какой-то осмысленный аналитический результат.

Насколько хватает фантазии

Список функций, которые может выполнять современная система обработки данных, не закрыт, потому что искусственный интеллект может помочь пользователю автоматизировать самые разные операции, начиная с каких-то простых вычислений, подготовки отчетов, написания писем и заканчивая предикативными моделями, а также моделированием или эмуляцией технологических процессов вплоть до выработки предложений по химическому составу лекарств в фармацевтической промышленности. Перечень возможных отраслевых задач, которые можно поручить такой системе, в принципе ограничен только фантазией пользователя и количеством данных, которые он может «скормить» системе.

ИИ-ассистент
Список задач, которые можно поручить ИИ-ассистенту, ограничен только человеческой фантазиейИсточник: Freepik

Конечно, обучение системы на большом массиве данных — это способ хороший, но очень дорогой, недоступный для большинства компаний, кроме крупнейших, обладающих большой инфраструктурой, вычислительными мощностями и средствами на то, чтобы приобретать сеты с данными. Еще 5 лет назад я бы сказала, что маленькие компании — это абсолютно нецелевая аудитория для систем с ИИ. Но сейчас именно маленькие компании интересуются ими даже больше, чем средний бизнес, потому что у ИИ-агентов появилась возможность выполнять функции, которые раньше были им недоступны, например, им стал доступен веб-скрейпинг, то есть агент может «бегать» по разным сайтам и оттуда вытаскивать то, что ты ему напишешь в промте, он может проводить бизнес-аналитику и оценку рынка работы с определенным партнером.

Кроме того, для малых и средних компаний возможно обучение системы на внутрикорпоративных данных — регламентах, инструкциях, справочных материалах, данных, накопившихся в ходе производственных процессов. Этот метод обучения называется методом дополненной генерации. Благодаря ему система может оказывать помощь в сфере внутренних процессов компании.

Поговорим?

Появление больших языковых моделей и их подключение к системам обработки данных породило возможность появления ИИ-агентов, которые собирают и обрабатывают информацию, и при этом общаются с пользователем на естественном языке.

ИИ-агенты научились понимать человека с полуслова
ИИ-агенты научились понимать человека с полусловаИсточник: Freepik

Очень важный тип ИИ-агента — агенты-консультанты, работающие в режиме вопрос-ответ. Главное отличие такого агента — он понимает, что ты у него спрашиваешь. Например, у него можно спросить, а что с моим счетом по такому-то договору, почему вы до сих пор его не оплатили. И агент может не только распознать этот текст, но и понять контекст, понять, о каком конкретно договоре идет речь и при необходимости задать уточняющий вопрос. И это все делает искусственный интеллект без участия не только людей, но и скриптов. Он сам решает, к какой базе данных ему нужно обратиться, в какие источники нужно посмотреть, после чего генерирует ответ в формате разговорной речи.

Не забывать о человеке

И еще надо упомянуть об одном обязательном требовании к современным бизнес-системам — Human-in-the-loop, возможности предоставления людьми обратной связи системе искусственного интеллекта. Обязательно должна быть предусмотрена возможность проверки результатов работы ИИ человеком. Из этого следует еще одно обязательное свойство современной системы: observability, то есть прозрачность того, что делает система, чтобы она не превращалась для людей в «черный ящик».