Исследователи НИУ ВШЭ создали чат-бота для поиска подходящих журналов по аннотации статьи

Команда исследователей из разных кампусов НИУ ВШЭ разработала удобный инструмент, который поможет учёным быстрее и точнее выбирать журналы для публикации своих статей. Это чат-бот в Telegram, способный подобрать релевантные научные издания по названию или аннотации уже готовой статьи. Проект реализован при поддержке Конкурса межкампусных академических инициатив и уже доступен всем желающим.
Зачем это нужно?
После написания статьи исследователь сталкивается с важным вопросом: куда её отправить? Отправка в несоответствующий журнал может привести к отказу – и потрачено будет драгоценное время. Особенно сложно бывает молодым авторам и тем, кто пишет междисциплинарные работы.
Идея проекта проста, но эффективна: сопоставлять содержание вашей статьи с тематикой журналов, а не просто искать совпадения ключевых слов. Такой семантический подход позволяет находить действительно релевантные издания.
Как собрали команду?
Идею выдвинула команда из Перми — стажеры-исследователи МЛЭНА: Никита Маткин, Егор Иванов, Алексей Смирнов, Михаил Усанин и Игорь Черницин. Позже к проекту присоединились специалисты из Москвы: Ирина Логинова, Анна Аксенова (Пиекалнитс) и Илья Самойлов.
Команда познакомилась в рамках Кадрового резерва НИУ ВШЭ, где представила свою идею, а затем победила в конкурсе, получив поддержку Корпоративной академии и Кадрового резерва.
Как работает бот?
Чат-бот использует технологию векторного поиска на основе модели BERT. Вот как это происходит:
1. База данных включает 7712 журналов из списка А
2. Для каждого журнала собрана информация о его целях и тематике (Aim & Scope), которая преобразована в числовой вектор — эмбеддинг.
3. Когда пользователь вводит название или аннотацию своей статьи, модель делает то же самое с этим текстом.
4. С помощью алгоритма (косинусная близость) бот находит самые близкие по смыслу журналы.
Такой подход учитывает не просто слова, а смысл текста, что значительно повышает точность поиска.
Как им пользоваться?
Очень просто:
Откройте бота в Telegram;
Вставьте текст статьи или аннотации на английском языке;
Получите список из 5 наиболее подходящих журналов;
Нажмите на кнопку и увидите описание журнала, квартиль, метрики и ссылку на сайт.
Можно просматривать и другие варианты. Бот не собирает персональные данные и не хранит ваши тексты – вся обработка происходит на защищённых серверах НИУ ВШЭ.
Проверка на практике
Изначально команда использовала метрики качества, но они показывали скромные результаты (~21%), потому что одна статья может подходить сразу нескольким журналам. Тогда было принято решение протестировать бота с помощью экспертов из 10 научных областей: от экономики и права до биологии и искусствоведения.
Результаты впечатлили: большинство оценок — от 7 до 9 баллов из 10. Особенно хорошо бот справляется с аннотациями, но и по названиям даёт качественные рекомендации.
Что дальше?
Команда планирует добавить поддержку русского языка, расширить базу на списки В, С и D, включить в анализ не только описания журналов, но и реальные аннотации опубликованных статей – это ещё больше повысит точность. Проект продолжает развиваться и уже сейчас помогает исследователям экономить время и увереннее делать шаг в большой научный мир.

