Magistral: Европа учит ИИ рассуждать на своих языках

Французский стартап Mistral представил Magistral — первую европейскую рассуждающую ИИ-модель, которая способна решать логические задачи. Плюсы релиза: open-source-версия, мультиязычность и ускорение Le Chat в 10 раз. Однако есть у новинки и серьезные минусы.
Автор Наука Mail
Развевающийся на ветру флаг ЕС с оборванными краями
Европе очень нужны суверенные решения в области ИИИсточник: Unsplash

Французский стартап Mistral AI вывел на рынок свою первую модель искусственного интеллекта, специализирующуюся на логических рассуждениях — Magistral. Это первый подобный европейский проект, призванный конкурировать с американскими и азиатскими аналогами, такими как OpenAI o3 или DeepSeek R1. Magistral представлен в двух версиях: открытая Magistral Small (24 млрд параметров) для разработчиков и более мощная коммерческая Magistral Medium для бизнеса.

Выход на рынок Mistral AI с моделями, специализированными под европейские языки — это логичное развитие для французского стартапа, учитывая сильную школу предобучения LLM в стране и поддержку со стороны ЕС.
Александр Панченко
д.к.н., руководитель научной группы «Вычислительная семантика» Института AIRI, руководитель Лаборатории обработки естественного языка Центра ИИ Сколтеха

Magistral не просто генерирует текст — он теперь способен решать многошаговые задачи: проводить расчеты, рассуждать алгоритмически, анализировать данные или создавать цепочки решений. Например, он может помочь в финансовом прогнозировании, разработке ПО или юридическом анализе, где важен пошаговый ход мыслей. Модель «прозрачна», то есть она показывает, как пришла к выводу, что критично для регулируемых отраслей.

Еще одна фишка новинки — мультиязычность. Magistral сохраняет логику рассуждений при переключении между языками, включая английский, французский, немецкий, испанский и даже арабский или русский. Как заявил CEO Mistral Артур Менш: «Исторически ИИ отлично «думал» только на английском или китайском. Magistral закрывает этот пробел для Европы».

Графики, показывающие точность моделей в разных тестах
Сравнение точности различных моделей в пяти тестах: математических, естественно-научных, кодинга и мультиязычности.Источник: Mistral.AI

Модель демонстрирует хорошие результаты по производительности. На тесте AIME2024 (оценка логики) Magistral Medium набрала 73,6% в базовой версии и 90% при использовании «коллективного решения» (режима majority vote). Открытая версия Small показала 70,7% и 83,3% соответственно. Однако Magistral пока отстает от новейших моделей конкурентов: DeepSeek R1−0528, OpenAI o3 и Gemini Pro 2.5.

Еще одно преимущество новинки в скорости. В фирменном чат-боте Le Chat Magistral работает в 10 раз быстрее аналогов благодаря режимам Flash Answers (мгновенные ответы) и Think Mode (углубленный анализ). Это позволяет использовать его в реальном времени для решения сложных задач, что наверняка будет воспринято позитивно пользователями из ЕС.

И, конечно же, Mistral сохраняет верность подходам open-source: Magistral Small доступен для бесплатного использования, модификации и самостоятельного развертывания под лицензией Apache 2.0. Это продолжение стратегии стартапа, ранее выпустившего «говорящую на арабском языке» модель Saba.

Адаптация под локальные языки действительно важна, поскольку универсальные модели часто теряют в качестве из-за излишней генерализированности. При этом сходство европейских языков позволяет использовать кросс-лингвальный перенос, улучшая результаты даже для менее распространенных языков. Если подход окажется эффективным, это может стать хорошим примером для других регионов, где лингвистическое разнообразие требует более гибких решений.
Александр Панченко
д.к.н., руководитель научной группы «Вычислительная семантика» Института AIRI, руководитель Лаборатории обработки естественного языка Центра ИИ Сколтеха

Компания обещает быстрые обновления новых моделей. Но уже сейчас ее можно применять в сферах, где требуются точность и прослеживаемость решений: от IT-разработки и креативных проектов до медицины или госуправления, подчеркнули создатели в своем релизе.

К слову, в России аналогичную нишу занимает, например, GigaChat от Сбера. Создатели «Гигачата» также фокусируются на поддержке русского языка и учитывают региональные особенности.