THE STUDY OF LARGE LANGUAGE MODELS FOR KNOWLEDGE OF THE SPECIFICS OF RAILWAY TRANSPORT

Authors

  • Анастасия Андреевна Романова Красноярский институт железнодорожного транспорта
  • Ангелина Андреевна Васильева Красноярский институт железнодорожного транспорта
  • Евгений Сергеевич Ильин Красноярский институт железнодорожного транспорта

Keywords:

artificial intelligence, ChatGPT, neural networks, large language models, railway transport

Abstract

Large LLM (Large Language Model) language models have made significant progress in the field of natural language processing in recent years. These models, using advanced neural network techniques and huge amounts of training data, have demonstrated capabilities in understanding and creating human-like text. Language models have great potential for solving urgent tasks of searching for information at the user's request. Large language models can make significant changes in the educational process, adapting to the current level of user training.

Conducted studies on the use of ChatGPT, also known as Chat Generative Pre-Trained Transformer, to solve the tests of the US Medical license exam (USMLE) [16], which confirmed the ability of ChatGPT to cross the threshold for obtaining a license, as well as conducting a number of experiments on the use of various LLMs to solve the Unified State Exam, confirm the high potential of using large language models for solving problems that were previously solved with the required level of quality exclusively with the involvement of human resources. 

 The article presents the results of research aimed at studying the knowledge of the specifics of railway transport using various language models. Four available language models have been tested using railway-related tests.

Based on the results obtained, the following conclusion is formulated: information in the field of railway transport in these models is presented in a limited volume that is not sufficient to build an intelligent system that helps the user study railway transport or be used as a decision support system in the transport industry. In this regard, the task of creating large language models based on the materials of the transport industry is relevant.

References

Скубак, А. С. Влияние нейросети chatgpt на образование / А. С. Скубак, И. Д. Нефедова // Проблемы и перспективы устойчивого развития промышленности в XXI веке: от теории к практике : МАТЕРИАЛЫ МЕЖДУНАРОДНОЙ СТУДЕНЧЕСКОЙ КОНФЕРЕНЦИИ, Санкт-Петербург, 12 апреля 2023 года. – Санкт-Петербург: Санкт-Петербургский государственный лесотехнический университет имени С.М. Кирова, 2023. – С. 220-223.

Alberts I.L. et al. Large language models (LLM) and ChatGPT: what will the impact on nuclear medicine be? // European journal of nuclear medicine and molecular imaging. – 2023. – С. 1-4.

Тюгинбаев, Д. Д. К вопросу о функционировании языковых моделей: как работает chatgpt / Д. Д. Тюгинбаев // Искусственный интеллект и большие данные (Big data) в судебной и правоохранительной системе: реалии и требование времени. – С. 96-99.

Коваленко, О. А. Применение нейросети ChatGPT в BI приложениях / О. А. Коваленко, А. В. Кривко-Красько // Бизнес. Образование. Экономика : Материалы Международной научно-практической конференции, Минск, 06–07 апреля 2023 года. – Минск: Государственное учреждение образования "Институт бизнеса Белорусского государственного университета", 2023. – С. 311-313.

Сулейманова, Д. О. Роль chatgpt в науке о данных / Д. О. Сулейманова, Т. Р. Магомаев // Общество, экономика, управление. – 2023. – Т. 8, № 2. – С. 48-54.

Оськин, А. Ф. Применение технологий искусственного интеллекта в историческом образовании / А. Ф. Оськин // Историческая информатика. – 2023. – № 2(44). – С. 145-159.

Гаркуша Н. С., Городова Ю. С. Педагогические возможности ChatGPT для развития когнитивной активности студентов // Профессиональное образование и рынок труда. 2023. № 1. С. 6–23.

Ильин, Е. С. Интеллектуальная система анализа данных на основе нейронных сетей: специальность 05.13.01 "Системный анализ, управление и обработка информации (по отраслям)" : диссертация на соискание ученой степени кандидата технических наук / Ильин Евгений Сергеевич. – Красноярск, 2004. – 174 с.

Капаца, Е. Сравниваем LLM-модели, чтобы потом внедрить без мороки / Е. Капаца – Текст : электронный // Tproger.ru : [сайт] – 2023. – URL: https://tproger.ru/articles/sravnivaem-llm-modeli-chtoby-potom-vnedrit-bez-moroki (дата обращения: 10.12.2023).

Kung TH, Cheatham M, Medenilla A, Sillos C, De Leon L, Elepaño C, et al. (2023) Performance of ChatGPT on USMLE: Potential for AI-assisted medical education using large language models. – URL: http://ojs.irgups.ru/index.php/mns/article/view/273/217 (дата обращения: 09.12.2023). – Текст : электронный.

Информационный ресурс для железнодорожников, жд. документы, инструкции, ответы на вопросы и другие полезные материалы для железнодорожника: сайт. – URL: https://rwlib.net/ (дата обращения: 11.12.2023).

Статистика чат-бота ChatGPTв 2023 году. – URL: https://inclient.ru/chatgptstats/#infografika-chatgp (дата обращения: 09.12.2023). – Текст : электронный.

Агазода, Р. YandexGPT против ChatGPT: сравнение возможностей / Р. Агазода – Текст : электронный // Tproger.ru : [сайт] – 2023. – URL: https://tproger.ru/articles/yandexgpt-protiv-chatgpt-sravnenie-vozmozhnostej (дата обращения: 10.12.2023).

Сравнил российские нейросети YaGPT и GigaChat с ChatGPT. – URL: https://androidinsider.ru/polezno-znat/sravnil-rossijskie-nejroseti-yagpt-i-gigachat-s-chatgpt-ne-ozhidal-chto-vse-tak-grustno.html (дата обращения: 10.12.2023). – Текст : электронный.

LLaMA (Large Language Model Meta AI) – URL: https://habr.com/ru/companies/ru_mts/articles/759210/ (дата обращения: 09.12.2023). – Текст : электронный.

Published

2024-05-07

How to Cite

Романова, А. А., Васильева, А. А., & Ильин, Е. С. (2024). THE STUDY OF LARGE LANGUAGE MODELS FOR KNOWLEDGE OF THE SPECIFICS OF RAILWAY TRANSPORT. The Electronic Scientific Journal "Young Science of Siberia", (1(23). Retrieved from https://ojs.irgups.ru/index.php/mns/article/view/1505

Issue

Section

Computer science and engineering

Most read articles by the same author(s)