
Современные языковые модели, такие как ChatGPT, Gemini и Claude, демонстрируют впечатляющие способности в обработке естественного языка. Они могут вести осмысленные диалоги, писать тексты и даже анализировать сложные данные. Однако внутренние механизмы, позволяющие им понимать человеческую речь, до сих пор остаются загадкой. Новое исследование ученых Гарвардского университета проливает свет на этот процесс. Обнаружено, что искустенный интеллект вначале полагается на позицию слов в предложении, но при достижении критического объема данных быстро переключается на анализ их смысла.
Процесс обучения ИИ во многом напоминает то, как ребенок осваивает язык. Сначала система запоминает порядок слов, определяя их роль в предложении по местоположению. Например, в фразе «Мария ест яблоко» подлежащее «Мария» обычно стоит перед глаголом «ест», а тот, в свою очередь, перед дополнением — «яблоко». На ранних этапах обучения искусственный интеллект использует именно эту стратегию, выстраивая связи между словами на основе их позиции.

Однако, как выяснили исследователи, при достаточном объеме тренировочных данных происходит резкий переход. ИИ начинает игнорировать позицию слов и фокусируется исключительно на их семантике. Этот сдвиг напоминает фазовый переход в физике — момент, когда система внезапно меняет свое состояние, как вода, превращающаяся в пар при нагревании.
Хьюго Куи, научный сотрудник Гарвардского университета и ведущий автор исследования, объясняет, что такой переход происходит не постепенно, а скачкообразно.

Это открытие стало возможным благодаря изучению механизма внутреннего внимания — ключевого компонента архитектуры трансформеров, лежащей в основе современных языковых моделей. Трансформеры анализируют текст, оценивая значимость каждого слова относительно других. Изначально они опираются на синтаксические паттерны, но при достижении определенного уровня обучения переключаются на семантику.
Ранее стало известно, что машинное обучение способно обнаружить ложь. Новый масштабный обзор ученых из ОАЭ подтверждает: алгоритмы глубокого обучения, анализируя речь, текст и даже мимику, распознают обман эффективнее привычных методов.
Понимание того, как ИИ учится обрабатывать текст, имеет большое значение для развития искусственного интеллекта. Во-первых, это позволяет оптимизировать обучение моделей, сокращая объем данных, необходимых для достижения высоких результатов. Во-вторых, знание внутренних механизмов помогает повысить безопасность ИИ, предотвращая неожиданное поведение систем.