
Работа вышла в MIT News и описывает платформу Capsa, разработанную компанией Themis AI — спин-оффом Массачусетского технологического института. Эта система выявляет, когда модель машинного обучения «не уверена» в своем ответе. Capsa модифицирует работу модели так, чтобы она сама замечала слабые места — неоднозначность, неполноту или предвзятость в обработке данных — и своевременно сигнализировала об этом.
Сооснователь Themis AI и профессор MIT Даниэла Рус объясняет: Capsa помогает не только находить проблемы, но и улучшать саму модель. Такой подход может быть особенно важен в критичных сферах — от автономного вождения до разработки лекарств.

Компания была основана в 2021 году Даниэлой Рус вместе с ее бывшими студентами Александром Амини и Элахе Ахмади. С тех пор они внедрили Capsa в телекоммуникациях, нефтегазовой промышленности и при создании более надежных чат-ботов. Один из ключевых кейсов — помощь фармацевтам в выявлении недостатков в прогнозах эффективности лекарств, что позволяет ускорить отбор кандидатов на новые препараты.
Capsa универсальна: ее можно использовать с любой моделью машинного обучения, включая большие языковые модели, LLM. Система сообщает, насколько уверен ИИ в каждом конкретном ответе. Это особенно важно для компаний, которые создают ИИ, работающий за пределами облака — например, на смартфонах или встраиваемых системах. В таких условиях важны и надежность, и экономия ресурсов.
По словам технического директора компании Стюарта Джеймисона, Capsa помогает даже в так называемой «цепочке рассуждений», когда ИИ объясняет ход своих мыслей. Система указывает, какие этапы вызывают сомнения, позволяя сосредоточиться на наиболее обоснованных рассуждениях.

Авторы проекта подчеркивают: цель Themis AI — не просто развитие ИИ, а создание доверия к нему. По мере того, как нейросети становятся частью повседневной жизни, особенно важно, чтобы они не только давали ответы, но и признавали свои ограничения.
Кстати, идеи Themis AI перекликаются с другим направлением развития ИИ — тем, как нейросети могут взять на себя рутину и стать полноценными помощниками в повседневной жизни. Один из примеров — работа Google над инструментом, который разберется с вашей почтой и сам напишет ответы в вашем стиле — об этом вы можете узнать в этой статье.