Студенты программы «Разработка информационных систем для бизнеса» победили в хакатоне по применению искусственного интеллекта
В НИУ ВШЭ – Пермь в рамках семинара «Искусственный интеллект для бизнеса» состоялся хакатон «Автоматическое выявление навыков из описаний вакансий». Организатором выступила Международная лаборатория экономики нематериальных активов. Первое место заняли студенты программы «Разработка информационных систем для бизнеса» пермской Вышки в составе Антона Заболотского, Вячеслава Большагина, Александры Ворожцовой, Назгуль Мустафиной, Глеба Чазова.
Цель хакатона — разработка модели, которая на основе описания вакансии будет автоматически выявлять требуемые навыки. Решение данной задачи позволит существенно ускорить процесс анализа рынка труда и выявлять необходимые для должности компетенции. Таким образом, модель может быть встроена в процесс мониторинга актуальных навыков и своевременного совершенствования образовательных программ.
На хакатон зарегистрировались 26 команд из разных городов и вузов России. В течение трех дней участники решали задачу автоматического распознавания сущностей – находили навыки в тексте вакансии. Для этого командам были отправлены данные 4 000 вакансий с выделенными навыками. На основе этого набор данных они обучали собственную модель. В результате 7 командам удалось решить задачу и представить результаты.
Победители хакатона «Автоматическое выявление навыков из описаний вакансий»
Первое место заняла команда студентов 2 курса образовательной программы «Разработки информационных систем для бизнеса» «пуBERTат» в составе Антона Заболотского, Вячеслава Большагина, Александры Ворожцовой, Назгуль Мустафиной, Глеба Чазова. Они дообучили готовую модель YandexGPT и получили самую высокую метрику качества F1 – 0.79. Поздравляем команду с победой!
Команда «пуBERTат», 1 место
Мы решили взять языковую модель YandexGPT и в рамках готового сервиса дообучили ее на представленных данных. Подобрали подходящий промпт и получили правильные ответы. Некоторые из нас в первый раз работали с большими языковыми моделями, в том числе и c Yandex API. Сначала мы не рассматривали это как универсальный способ решения задачи, а просто протестировали. Тестировать разные модели для решения практической задачи, не какой-то игровой, а действительно реальной, и пробовать разные подходы и методы – это большой опыт для дальнейшего развития.
В целом, было интересно погрузиться в сферу машинного обучения, потому что у нас ещё не было такого курса. В процессе выполнения задачи мы стали изучать структуры процессов и новые термины. Мы учимся в Вышке второй год, и это наш первый опыт участия в хакатоне. Было легко зарегистрироваться и полезно послушать спикеров семинара «Искусственный интеллект для бизнеса». Работа в команде была веселой, мы находили забавные навыки и кейсы. Кроме того, задача очень интересная и сложная, она дала нам возможность ознакомиться с широким спектром вариантов решения.
Второе место заняла команда «NerdsTeam», состоящая из студентов МГУ – Александра Константинова и Андрея Зданевича. Для решения задачи студенты обучили модель BERT с использованием библиотеки Spacy. Эффективность их модели составила 0.78.
Команда «Алгоритм Мастера» заняла третье место с результатом 0.73. Команда состоит из выпускников школ – Павла Коркодинова (Лицей НИУ ВШЭ – Пермь), Семёна Епанова (Лицей №10, Пермь), Ивана Сазанова (Школа ЦПМ, Москва). Они дообучили модель BERT с различными параметрами.
Команда «Алгоритм Мастера», 3 место
Для решения представленной задачи мы предварительно обработали данные, далее использовали модель BERT. Мы выставили различные гиперпараметры и выбрали лучшие итерации в процессе обучения. Мы раньше работали с компьютерным зрением и другими задачами в машинном обучении. Для хакатона нам пришлось освоить методы обработки естественного языка. Мы специально решили участвовать, чтобы вникнуть в эту область, и нам понравилось.
Это наш первый хакатон по обработке естественного языка, ранее мы участвовали в хакатонах по компьютерному зрению и обработке структурированных данных. Хакатон позволяет быстро влиться в эту сферу и изучить то, что не знал ранее. Хакатон – это хорошая мотивация для студентов и школьников проявить навыки в сфере искусственного интеллекта и заинтересоваться ей. Взаимодействие построено очень удобно, всё было хорошо организовано. Нам всё понравилось.
Организаторы хакатона отметили высокий уровень владения инструментарием для работы с искусственным интеллектом участников хакатона. Пожелали всем командам успешного развития в академической среде и наградили ценными призами. Спасибо всем участникам за предложенные решения!