Роль библиотек в эпоху искусственного интеллекта: аналитический взгляд на новые ИИ-технологии и их применение
Ключевые слова:
искусственный интеллект, цифровая неопределенность, информационный шум, генеративные нейронные сети, интеллектуальная поисковая система, семантический поиск, верификация, научное наследие, большие языковые модели, Retrieval Augmented GenerationАннотация
В статье рассматривается трансформация роли современных библиотек в условиях «цифровой неопределенности» и стремительного развития технологий искусственного интеллекта. Авторы выполнили ретроспективный обзор эволюции нейросетевых архитектур – от первых вероятностных моделей перцептрона Фрэнка Розенблатта и рекуррентных сетей, решивших проблему долгосрочной памяти, до современных трансформеров и больших языковых моделей, обосновав неизбежность текущего технологического перехода. В работе систематизированы передовые инструменты генеративного искусственного интеллекта, включая диффузионные модели визуализации (Stable Diffusion), технологии распознавания речи и понимания структуры документов с детальной оценкой перспектив их внедрения в процессы сохранения научного наследия. Особый акцент сделан на риски «информационного шума», галлюцинации нейронных сетей и размывание понятия авторства, что актуализирует новую роль библиотеки как гаранта верифицированного знания в соответствии с принципами Международной федерации библиотечных ассоциаций. Практическая значимость исследования заключается в техническом описании опыта Центральной научной библиотеки Федерального исследовательского центра Иркутского института химии им. А.Е. Фаворского Сибирского отделения Российской академии наук по разработке локальной интеллектуальной поисковой системы для эффективного поиска и анализа содержания научной литературы. Представлена архитектура на основе методологии Retrieval Augmented Generation и локальных языковых моделей, которая обеспечивает семантический поиск по оцифрованным профильным (в том числе химическим) фондам, суверенитет данных и верифицируемость ответов со ссылками на первоисточники.
Библиографические ссылки
Rosenblatt F. The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain // Psychological Review. 1958. Vol. 65. Iss. 6. P. 386–408.
Николенко С., Кадурин А., Архангельская Е. Глубокое обучение. Погружение в мир нейронных сетей. СПб. : Питер, 2018. 480 с.
Hochreiter S., Schmidhuber J. Long Short-Term Memory // Neural Computation. 1997. Vol. 9. Iss. 8. P. 1735–1780.
LeCun Y., Bengio Y., Hinton G. Deep Learning // Nature. 2015. Vol. 521. Iss. 7553. P. 436–444. DOI 10.1038/nature14539.
Attention Is All You Need / A. Vaswani, N. Shazeer, N. Parmar et al. // 31st Conference on Neural Information Processing Systems (NIPS 2017). Long Beach, 2017. DOI 10.48550/ARXIV.1706.03762.
Transformer – новая архитектура нейросетей для работы с последовательностями // Habr : сайт. URL : https://habr.com/ru/articles/341240/ (дата обращения: 05.08.2025).
Тихомиров М.М. Большие языковые модели // ИСП РАН : сайт. URL : https://tpc.ispras.ru/wp-content/uploads/2023/12/lecture14-2023.pdf (дата обращения: 05.08.2025).
Chain of Thought Prompting Elicits Reasoning in Large Language Models / J. Wei, X. Wang, D. Schuurmans et al. // 36th Conference on Neural Information Processing Systems (NeurIPS 2022). Long Beach, 2022. DOI arxiv.org/pdf/2201.11903v1.
High-Resolution Image Synthesis with Latent Diffusion Models / R. Rombach, A. Blattmann, D. Lorenz et al. // Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New Orleans, LA, 2022. P. 10674–10685. DOI 10.1109/CVPR52688.2022.01042.
Zhang L., Rao A., Agrawala M. Adding Conditional Control to Text-to-Image Diffusion Models // Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV). Paris, 2023. P. 3836–3847. DOI 10.1109/ICCV51070.2023.00355.
LoRA: Low-Rank Adaptation of Large Language Models / E.J. Hu, Y. Shen, P. Wallis et al. // International Conference on Learning Representations (ICLR). 2022. DOI arxiv.org/abs/2106.09685.
Robust Speech Recognition via Large-Scale Weak Supervision / A. Radford, J.W. Kim, T. Xu et al. // Proceedings of the 40th International Conference on Machine Learning (ICML). Honolulu, 2023. URL : https://cdn.openai.com/papers/whisper.pdf (дата обраще-ния: 04.08.2025).
Земсков А.И., Телицына А.Ю. Демонстрация возможностей чата GPT в библиотечной деятельности // Научные и технические библиотеки. 2024. № 4. С. 131–145.
IFLA Statement on Libraries and Artificial Intelligence // IFLA : сайт. URL : https://repository.ifla.org/items/8c05d706-498b-42c2-a93a-3d47f69f7646 (дата обращения: 05.08.2025).
Шрайберг Я.Л., Волкова К.Ю. Вопросы авторского права в отношении произведений, созданных при помощи генеративного искусственного интеллекта // Научные и технические библиотеки. 2025. № 2. С. 115–130.
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks / P. Lewis, E. Perez, A. Piktus et al. // 34th Conference on neural information processing systems NeurIPS. 2020. URL : https://arxiv.org/pdf/2005.11401v1 (дата обращения: 05.08.2025).
Llama 2: Open Foundation and Fine-Tuned Chat Models / H. Touvron, L. Martin, K. Stone et al. DOI 10.48550/arXiv.2307.09288.
Йылмаз Б. Культура чтения в цифровом мире // Книга. Чтение. Медиасреда. 2024. Т. 2. № 1. С. 17–26.