В НовГУ разработали инструкцию по созданию датасета для распознавания эмоций
16 мая 2025, 16:53 1682
В НовГУ представили проект «Подготовка датасета для распознавания эмоций». Презентация прошла на конкурсе студенческих проектов с научной составляющей «PRO.Научный элемент».
Датасет — это структурированный набор данных, который используется для построения моделей машинного обучения. В данном случае речь о том, чтобы научить нейросеть распознавать эмоции в человеческом голосе. Студенты Политехнического института разработали инструкцию, которая поможет сформировать такой датасет. В ней указаны возможные источники данных, критерии оценки эмоций и смета предполагаемых расходов.
— Мы остановились на пяти эмоциях: радость, злость, страх, печаль и нейтральность, — рассказал участник проектной команды, студент второго курса Владислав Билев. — Определить их можно по множеству разных параметров: громкость, темп, высота речи и так далее. Соответственно, важно учитывать эти характеристики, чтобы будущая программа работала корректно. В качестве возможных источников данных могут использоваться бесплатные видеохостинги, аудиокниги, фильмы и сериалы. Они более приближены к реальным условиям и на них нужно тратить меньше ресурсов, но качество звука не всегда на высоте. Можно использовать и платные источники: озвучка актёрами, покупка цифрового контента. Это позволит получить более качественные данные.
Студенты Гуманитарного института представили проект биографического словаря «Ученики Новгородской архиерейской школы (1706–1727 гг.)». Это справочное издание, где будет представлена краткая информация о происхождении учеников, их карьере, родственных связях. Основой словаря стала база данных, собранная студентами по итогам изучения порядка 50 архивных документов XVIII века общим объёмом около 3000 листов. Всего в базу было внесено 528 имён.
— На данный момент оформлено 370 биографических очерков, — рассказала будущий историк Анна Тараненко. — Мы установили происхождение 297 учеников, карьеру для 241, семейно-родственные связи для 119. У 47 человек были выявлены родственники также из числа учащихся школы, либо из учеников Новгородской духовной семинарии. В словаре будет использована информация из архивных документов, ранее не введённая в научный оборот. Например, нам удалось выявить новые подробности биографии Фёдора Максимова — одного из учеников школы, который впоследствии стал преподавателем и автором учебника «Грамматика» 1723 года. Мы обнаружили информацию о его жене и дочери, хотя ранее считалось, что у него не было семьи.
На данный момент подготовлено более 70% словарных статей. Издание также будет включать иллюстративный, картографический и схематический материал, фрагменты рукописей учеников.
Членами конкурсной комиссии стали заместитель проректора по образовательной деятельности НовГУ Наталья Федотова, начальник отдела аспирантуры и молодёжной науки Ольга Алексеева, заведующий кафедрой дизайна архитектурной среды Алексей Гаврилов, заведующая кафедрой всемирной истории и международных отношений Валентина Грохотова, заведующая кафедрой иностранных языков, перевода и межкультурной коммуникации Елена Жукова, заведующая кафедрой радиосистем Ирина Жукова, доцент цифровой кафедры Татьяна Кудряшова, заведующая кафедрой истории государства и права Елена Макарова, доцент кафедры истории России и археологии Ирина Самойлова, генеральный директор компании «Новбиотех» Наталья Севостьянова, директор Центра развития публикационной активности Оксана Фихтнер.
Конкурс «PRO.Научный элемент» организован Школой проектного обучения НовГУ.
Эту и другие новости читайте в официальном телеграм-канале Новгородского университета.