
Депрессия является одним из наиболее распространенных психических расстройств. По данным Всемирной организации здравоохранения на 2025 год, во всем мире от депрессии страдает около 330 млн человек. Это может быть самостоятельное расстройство или сопутствующее другим заболеваниям, в том числе соматическим.
Специалисты отмечают, что депрессия может скрываться за соматическими симптомами — головной болью, проблемами с сердцем, пищеварением или общим ухудшением самочувствия, при этом определить «телесную» причину невозможно. У врачей не всегда хватает времени и квалификации, чтобы провести углубленную диагностику и поставить точный диагноз.
Одним из перспективных методов диагностики депрессии считается анализ акустических характеристик голоса. По словам ученых, такой метод имеет преимущества по сравнению с традиционными способами, основанных на самоотчете или интервью, так как исключает фактор «социальной желательности». Голос считается объективным показателем, который отражает состояние человека, при этом произвольно изменять голос для сокрытия симптомов человек не может, утверждают исследователи.
Зарубежные ученые выпустили много материалов о подобной диагностике, даже с использованием нейросетей, однако данных о применении технологий на практике пока нет. В России голос используют для проверки состояния людей во время полета в космос, но методы не для определения депрессии. Ученые из НГУ стали первыми в стране, кто разработал подобную технологию.

Исследователи провели больше 90 интервью и обучили нейросетевую модель, которая распознает речь по четырем уровням развития депрессии — от отсутствия симптомов до тяжелой формы. По словам разработчиков, речь — естественный биомаркер психического состояния, и даже короткий отрывок может рассказать об энергетике голоса, меняющейся при тревожных состояниях и расстройствах.
В основу разработки легла современная архитектура wav2veс, которая позволяет извлекать векторные акустические характеристики голоса. Обученная модель демонстрирует высокую точность, которая сопоставима с результатами ведущих зарубежных исследований: точность оценивалась на основе показателя F1 — гармоническое среднее между точностью (precision) и полнотой (recall), F1 достиг значения >0.94. Для практического использования технологии был создан прототип GUI-приложения NeuroVoiсe, который реализован на базе фреймворка PyQt5. Интерфейс обеспечивает полный цикл работы с данными — от загрузки или записи аудио до визуализации результатов и экспорта записей. Прототип позволяет как загружать уже сделанные записи, так и проводить оценку на лету
Разработчики отмечают, что технология не заменит психолога или психиатра, но может помочь специалистам общего профиля для выявления депрессии при соматических заболеваниях. Исследователи планируют усовершенствовать проект: расширить датасет и сформировать базу данных интервью участников эксперимента на русском языке, аналогичную англоязычной DAIC-WOZ. Далее нейросети будут обучать на расширенном датасете и интегрировать модели в итоговое приложение, а затем протестировать его.
Ранее Наука Mail рассказывала, что воздействие экстремальной жары связано с более высокой распространенностью депрессии и тревожных расстройств на уровне целых штатов США.

