ИССЛЕДОВАНИЕ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ НА ЗНАНИЕ СПЕЦИФИКИ ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА

Авторы

  • Анастасия Андреевна Романова Красноярский институт железнодорожного транспорта
  • Ангелина Андреевна Васильева Красноярский институт железнодорожного транспорта
  • Евгений Сергеевич Ильин Красноярский институт железнодорожного транспорта

Ключевые слова:

искусственный интеллект, ChatGPT, нейронные сети, большие языковые модели, железнодорожный транспорт

Аннотация

Большие языковые модели LLM (Large Language Model) в последние годы позволили добиться значительного прогресса в области обработки естественного языка. Эти модели, использующие передовые методы нейронных сетей и огромные объемы обучающих данных, продемонстрировали возможности в понимании и создании человекоподобного текста. Языковые модели имеют большой потенциал для решения актуальных задач поиска информации по запросу пользователя. Большие языковые модели могут внести значительные изменения в образовательный процесс, адаптируясь на текущий уровень подготовки пользователя.
Проведенные исследования по использованию ChatGPT, также известной как Chat Generative Pre-Trained Transformer, для решения тестов экзамена на получение медицинской лицензии в США (USMLE) [16], подтвердившие способность ChatGPT перейти порог для получения лицензии, а так же проведение ряда экспериментов по применению различных LLM для решения ЕГЭ, подтверждают высокий потенциал использования больших языковых моделей для решения задач, которые ранее с требуемым уровнем качества решались исключительно с привлечением человеческих ресурсов.
В статье приведены результаты исследований, направленных на изучение знаний специфики железнодорожного транспорта различными языковыми моделями. Четыре доступных языковых модели протестированы с помощью тестов по железнодорожной тематике.
На основе полученных результатов сформулирован следующий вывод: информация в области железнодорожного транспорта в данных моделях представлена в ограниченном объеме не достаточном для построения интеллектуальной системы, помогающей пользователю изучать железнодорожный транспорт или использоваться в качестве системы поддержки принятия решения в транспортной отрасли. В связи с этим задача создания больших языковых моделей дообученных на материалах транспортной отрасли является актуальной.

Библиографические ссылки

Скубак, А. С. Влияние нейросети chatgpt на образование / А. С. Скубак, И. Д. Нефедова // Проблемы и перспективы устойчивого развития промышленности в XXI веке: от теории к практике : МАТЕРИАЛЫ МЕЖДУНАРОДНОЙ СТУДЕНЧЕСКОЙ КОНФЕРЕНЦИИ, Санкт-Петербург, 12 апреля 2023 года. – Санкт-Петербург: Санкт-Петербургский государственный лесотехнический университет имени С.М. Кирова, 2023. – С. 220-223.

Alberts I.L. et al. Large language models (LLM) and ChatGPT: what will the impact on nuclear medicine be? // European journal of nuclear medicine and molecular imaging. – 2023. – С. 1-4.

Тюгинбаев, Д. Д. К вопросу о функционировании языковых моделей: как работает chatgpt / Д. Д. Тюгинбаев // Искусственный интеллект и большие данные (Big data) в судебной и правоохранительной системе: реалии и требование времени. – С. 96-99.

Коваленко, О. А. Применение нейросети ChatGPT в BI приложениях / О. А. Коваленко, А. В. Кривко-Красько // Бизнес. Образование. Экономика : Материалы Международной научно-практической конференции, Минск, 06–07 апреля 2023 года. – Минск: Государственное учреждение образования "Институт бизнеса Белорусского государственного университета", 2023. – С. 311-313.

Сулейманова, Д. О. Роль chatgpt в науке о данных / Д. О. Сулейманова, Т. Р. Магомаев // Общество, экономика, управление. – 2023. – Т. 8, № 2. – С. 48-54.

Оськин, А. Ф. Применение технологий искусственного интеллекта в историческом образовании / А. Ф. Оськин // Историческая информатика. – 2023. – № 2(44). – С. 145-159.

Гаркуша Н. С., Городова Ю. С. Педагогические возможности ChatGPT для развития когнитивной активности студентов // Профессиональное образование и рынок труда. 2023. № 1. С. 6–23.

Ильин, Е. С. Интеллектуальная система анализа данных на основе нейронных сетей: специальность 05.13.01 "Системный анализ, управление и обработка информации (по отраслям)" : диссертация на соискание ученой степени кандидата технических наук / Ильин Евгений Сергеевич. – Красноярск, 2004. – 174 с.

Капаца, Е. Сравниваем LLM-модели, чтобы потом внедрить без мороки / Е. Капаца – Текст : электронный // Tproger.ru : [сайт] – 2023. – URL: https://tproger.ru/articles/sravnivaem-llm-modeli-chtoby-potom-vnedrit-bez-moroki (дата обращения: 10.12.2023).

Kung TH, Cheatham M, Medenilla A, Sillos C, De Leon L, Elepaño C, et al. (2023) Performance of ChatGPT on USMLE: Potential for AI-assisted medical education using large language models. – URL: http://ojs.irgups.ru/index.php/mns/article/view/273/217 (дата обращения: 09.12.2023). – Текст : электронный.

Информационный ресурс для железнодорожников, жд. документы, инструкции, ответы на вопросы и другие полезные материалы для железнодорожника: сайт. – URL: https://rwlib.net/ (дата обращения: 11.12.2023).

Статистика чат-бота ChatGPTв 2023 году. – URL: https://inclient.ru/chatgptstats/#infografika-chatgp (дата обращения: 09.12.2023). – Текст : электронный.

Агазода, Р. YandexGPT против ChatGPT: сравнение возможностей / Р. Агазода – Текст : электронный // Tproger.ru : [сайт] – 2023. – URL: https://tproger.ru/articles/yandexgpt-protiv-chatgpt-sravnenie-vozmozhnostej (дата обращения: 10.12.2023).

Сравнил российские нейросети YaGPT и GigaChat с ChatGPT. – URL: https://androidinsider.ru/polezno-znat/sravnil-rossijskie-nejroseti-yagpt-i-gigachat-s-chatgpt-ne-ozhidal-chto-vse-tak-grustno.html (дата обращения: 10.12.2023). – Текст : электронный.

LLaMA (Large Language Model Meta AI) – URL: https://habr.com/ru/companies/ru_mts/articles/759210/ (дата обращения: 09.12.2023). – Текст : электронный.

Загрузки

Опубликован

2024-05-07

Как цитировать

Романова, А. А., Васильева, А. А., & Ильин, Е. С. (2024). ИССЛЕДОВАНИЕ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ НА ЗНАНИЕ СПЕЦИФИКИ ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА. Электронный научный журнал "Молодая наука Сибири", (1(23). извлечено от https://ojs.irgups.ru/index.php/mns/article/view/1505

Выпуск

Раздел

Информатика, вычислительная техника