• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
  • НИУ ВШЭ в Перми
  • Новости
  • Исследователи НИУ ВШЭ создали чат-бота для поиска подходящих журналов по аннотации статьи

Исследователи НИУ ВШЭ создали чат-бота для поиска подходящих журналов по аннотации статьи

Исследователи НИУ ВШЭ создали чат-бота для поиска подходящих журналов по аннотации статьи

Ирина Логинова

Команда исследователей из разных кампусов НИУ ВШЭ разработала удобный инструмент, который поможет учёным быстрее и точнее выбирать журналы для публикации своих статей. Это чат-бот в Telegram, способный подобрать релевантные научные издания по названию или аннотации уже готовой статьи. Проект реализован при поддержке Конкурса межкампусных академических инициатив и уже доступен всем желающим.

Зачем это нужно?

После написания статьи исследователь сталкивается с важным вопросом: куда её отправить? Отправка в несоответствующий журнал может привести к отказу – и потрачено будет драгоценное время. Особенно сложно бывает молодым авторам и тем, кто пишет междисциплинарные работы.  

Идея проекта проста, но эффективна: сопоставлять содержание вашей статьи с тематикой журналов, а не просто искать совпадения ключевых слов. Такой семантический подход позволяет находить действительно релевантные издания.

Как собрали команду?

Идею выдвинула команда из Перми — стажеры-исследователи МЛЭНА: Никита Маткин, Егор Иванов, Алексей Смирнов, Михаил Усанин и Игорь Черницин. Позже к проекту присоединились специалисты из Москвы: Ирина Логинова, Анна Аксенова (Пиекалнитс) и Илья Самойлов.  

Команда познакомилась в рамках Кадрового резерва НИУ ВШЭ, где представила свою идею, а затем победила в конкурсе, получив поддержку Корпоративной академии и Кадрового резерва.

Как работает бот?

Чат-бот использует технологию векторного поиска на основе модели BERT. Вот как это происходит:

1. База данных включает 7712 журналов из списка А

2. Для каждого журнала собрана информация о его целях и тематике (Aim & Scope), которая преобразована в числовой вектор — эмбеддинг.

3. Когда пользователь вводит название или аннотацию своей статьи, модель делает то же самое с этим текстом.

4. С помощью алгоритма (косинусная близость) бот находит самые близкие по смыслу журналы.

Такой подход учитывает не просто слова, а смысл текста, что значительно повышает точность поиска.

Как им пользоваться?

Очень просто:

 Откройте бота в Telegram;

 Вставьте текст статьи или аннотации на английском языке;

 Получите список из 5 наиболее подходящих журналов;

 Нажмите на кнопку и увидите описание журнала, квартиль, метрики и ссылку на сайт.

Можно просматривать и другие варианты. Бот не собирает персональные данные и не хранит ваши тексты – вся обработка происходит на защищённых серверах НИУ ВШЭ.

Проверка на практике

Изначально команда использовала метрики качества, но они показывали скромные результаты (~21%), потому что одна статья может подходить сразу нескольким журналам. Тогда было принято решение протестировать бота с помощью экспертов из 10 научных областей: от экономики и права до биологии и искусствоведения.

Результаты впечатлили: большинство оценок — от 7 до 9 баллов из 10. Особенно хорошо бот справляется с аннотациями, но и по названиям даёт качественные рекомендации.

Что дальше?

Команда планирует добавить поддержку русского языка, расширить базу на списки В, С и D, включить в анализ не только описания журналов, но и реальные аннотации опубликованных статей – это ещё больше повысит точность. Проект продолжает развиваться и уже сейчас помогает исследователям экономить время и увереннее делать шаг в большой научный мир.