Общество 30 дек 2025 869

Центр «Бэлиг» в Бурятии приступил к реализации проекта по распознаванию бурятской речи

Стартом нового этапа цифровизации бурятского языка стал проект по сбору аудио дата-сета.  

Новый проект реализуется в соответствии с достигнутыми недавно в Москве договоренностями центра «Бэлиг».

Речь идет о соглашении с Домом народов России и договоре с компанией «Яндекс». Первый документ касается сохранения этнокультурного и языкового многообразия Бурятии, в том числе путём разработки механизмов цифровизации родных языков.

Договор с компанией «Яндекс» касается передачи ей центром «Бэлиг» базы данных голосовых записей на бурятском языке, необходимой для осуществления работ по синтезу и распознаванию речи.

Напомним, распознавание речи – это технология искусственного интеллекта, которая преобразует устную речь в машиночитаемый текст. Это многоуровневый процесс, включающий анализ звука, его разделение на фонемы, слова и фразы, и формирование текстовой расшифровки с помощью сложных алгоритмов и нейросетей, что позволяет компьютерам понимать команды, вести диалог и выполнять задачи.

В дальнейшем эта технология применяется при разработке голосовых помощников, голосового поиска, диктовки и транскрипции, управления устройствами. Также могут быть созданы голосовые боты-консультанты и многое другое.

Фото: Бэлиг