Нейросеть хранит все больше и больше информации о тексте

Новый тест научит роботов понимать расплывчатые инструкции

«Принеси что-нибудь попить» — простая просьба для человека, но не для робота. Новый открытый набор данных поможет ИИ-системам научиться понимать контекст, предпочтения и даже нормы безопасности.
Смартфон с приложениями на фиолетовом фоне
В России разработали крупнейший набор данных для обучения ИИ понимать человеческие просьбыИсточник: Наука Mail

Исследователи из Института искусственного интеллекта AIRI, МФТИ и Центра робототехники Сбера представили AmbiK — крупнейший в мире открытый набор данных, созданный специально для проверки, как робототехнические системы интерпретируют двусмысленные и неполные инструкции. Он включает в себя 2 тысячи бытовых задач с пометками по типу неоднозначности — от предпочтений до безопасности.

Для человека фраза «Принеси что-нибудь попить» кажется банальной. Мы интуитивно учитываем контекст: кто просит, какое время суток, какие напитки в холодильнике. Для ИИ это — набор неясностей. Одни системы начинают переспрашивать по каждому пункту, другие — действуют наугад, что в быту может быть неудобно или даже опасно.

AmbiK классифицирует типы неопределенности на три ключевые категории:

  • общие знания о мире и контекст (Что вообще считается «напитком»? Чай? Вода? Молоко?);

  • предположения о предпочтениях человека (Например, мама обычно пьет чай без сахара);

  • соображения безопасности (Не стоит приносить кипяток ребенку. Лучше остудить воду).

Набор данных позволяет тестировать, как ИИ справляется с пониманием команд: когда стоит переспрашивать, а когда можно действовать самостоятельно. Исследование показало, что даже самые передовые модели правильно определяли необходимость уточнения лишь в 20% случаев.

Проект позволит смоделировать ситуации, в которых робот сталкивается с неполными инструкциями и должен запросить уточнения только тогда, когда это действительно необходимо
Проект позволит смоделировать ситуации, в которых робот сталкивается с неполными инструкциями и должен запросить уточнения только тогда, когда это действительно необходимоИсточник: Freepik

Кроме того, AmbiK содержит и многошаговые инструкции — редкость для подобных наборов. Это позволяет анализировать, на каком этапе плана действия у ИИ возникает затруднение.

Датасет пригоден не только для оценки распознавания нечетких команд, но и для систем, занимающихся планированием поведения.
Алексей Ковалев
руководитель группы «‎Воплощенные агенты» лаборатории «‎Когнитивные системы ИИ» Института AIRI

AmbiK открыт для научного сообщества и индустрии. Его текстовая структура позволяет использовать данные без привязки к визуальной информации — например, для тестирования языковых моделей.

Разработка такого бенчмарка — важный шаг к созданию ИИ-помощников, способных понимать пользователей интуитивно. Ведь умный ассистент — это не только о вычислительной мощности, но и о здравом смысле.

Ранее мы рассказывали, что для людей с зависимостью от ИИ-чатов придумали название.