Preview

Вестник НИЯУ МИФИ

Расширенный поиск

МЕТОДИКА ФОРМИРОВАНИЯ БАЗЫ ДАННЫХ ХАРАКТЕРИСТИК СЛОЖНОГО ТЕХНОЛОГИЧЕСКОГО ОБЪЕКТА С ИСПОЛЬЗОВАНИЕМ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ

https://doi.org/10.26583/vestnik.2024.5.7

EDN: PJFXNC

Аннотация

Атомная энергетика играет важную роль в обеспечении безопасности многих стран мира. При проектировании и эксплуатации таких сложных технологических объектов (СТО), как атомные электростанции (АЭС), критически важно учитывать их характеристики для обеспечения безопасной работы. Актуальность темы исследования заключается в необходимости разработки методики, позволяющей ускорить процесс выявления целевой информации, содержащейся в научных публикациях, для предприятий атомной отрасли. Отсутствие научных работ, описывающих применение языковых моделей для анализа и выделения характеристик из сложных технологических объектов, подчеркивает необходимость проведения исследования. В работе в качестве примера такого объекта выбрана АЭС. Для проведения ряда экспериментов по выделению технических характеристик СТО составлен перечень параметров профиля атомной электростанции (35 параметров) и сформирован набор данных по атомным электростанциям (60 научных публикаций, содержащих сведения об АЭС Линьао). Разработана программа, которая позволяет обрабатывать содержащиеся в научных публикациях данные путем загрузки статей в языковую модель, написания запросов и получения ответов для последующего составления профиля сложного технологического объекта. Результаты работы показали, что предложенная методика позволяет программно обрабатывать научные публикации для составления профиля АЭС.

Об авторах

А. Р. Матвеева
Национальный исследовательский ядерный университет «МИФИ»
Россия

Студент



Е. В. Антонов
Национальный исследовательский ядерный университет «МИФИ»
Россия

Ассистент кафедры анализа конкурентных систем



Список литературы

1. Polak M.P., Morgan D. Extracting accurate materials data from research papers with conversational language models and prompt engineering // Nature Communications, 2024.V. 15(1), 1569.

2. Yao Y., Duan J., Xu K., Cai Y., Sun Z., Zhang Y. A survey on large language model (LLM) security and privacy: The good, the bad, and the ugly // High-Confidence Computing, 2024. 100211.

3. Sui Y., Zhou M., Zhou M., Han S., Zhang D. Table meets LLM: Can large language models understand structured table data? A benchmark and empirical study // Proceedings of the 17th ACM International Conference on Web Search and Data Mining, 2024. P. 645–654.

4. Федорова А.А. Необходимые правила потребления информации для снижения негативного влияния информационного общества // Скиф. Вопросы студенческой науки, 2020. № 5–1. С. 157–162.

5. Jiang A.Q., Sablayrolles A., Mensch A., Bam-ford C., Chaplot D.S., etc. Mistral 7B. arXiv preprint arXiv:2310.06825.

6. Ali A.H., Alajanbi M., Yaseen M.G., Abed S.A. Chatgpt4, DALL· E, Bard, Claude, BERT: Open Possibilities // Babylonian Journal of Machine Learning, 2023. Р. 17–18.

7. Dubois Y., Li C.X., Taori R., Zhang T., Gulra¬jani I., Ba J., etc. AlpacaFarm: A simulation framework for methods that learn from human feedback // Advances in Neural Information Processing Systems, .2024. V. 1. URL: https://doi.org/10.48550/arXiv.2305.14387

8. Chaka C. Detecting AI content in responses generated by ChatGPT, YouChat, and Chatsonic: The case of five AI content detection tools // Journal of Applied Learning and Teaching, 2023. V. 6(2). P. 1–11.

9. Кумратова А.М., Морозова Н.В., Василен-ко А.И., Когай И.Е. Анализ возможностей нейрон¬ной сети на основе языковой модели GPT-3 и способы ее применения на производстве // Вестник Адыгейского государственного университета. Серия 4: Есте¬ст-венно-математические и технические науки, 2023. Вып. 1 (316). C. 80–85.

10. Zhan T., Shi C., Shi Y., Li H., Lin Y. Optimization Techniques for Sentiment Analysis Based on LLM (GPT-3) // Applied and Computational Engineering, 2024. V.67(1). P.41-47.

11. Yenduri G., Ramalingam M., Selvi G.C., Supriya Y., Srivastava G., etc. GPT (generative pre-trained transformer) – a comprehensive review on enabling technologies, potential applications, emerging challenges, and future directions // IEEE Access, 2023. DOI: 10.1109/ACCESS.2024.3389497

12. Wang B., Xie Q., Pei J., Chen Z., Tiwari P., Li Z., Fu J. Pre-trained language models in biomedical domain: A systematic survey // ACM Computing Surveys, 2023. V. 56(3), P. 1–52.

13. Hong Z., Ward, L., Chard, K., Blaiszik, B., Foster I. Challenges and advances in information extraction from scientific literature: a review // JOM, 2021. V. 73(11), P. 3383–3400.

14. Han S., Zhang R.F., Shi L., Richie R., Li, H., Tseng A., etc. Classifying social determinants of health from unstructured electronic health records using deep learning-based natural language processing // Journal of biomedical informatics, 2022. V. 127. 103984.

15. Kåhrström, F. Natural Language Processing for Swedish Nuclear Power Plants: A study of the challenges of applying Natural language processing in Operations and Maintenance and how BERT can be used in this industry. Visby: Uppsala Universitet, 2022.

16. URL: http://uu.diva-portal.org/smash/get/diva2: 1678697/ FULLTEXT01.pdf


Рецензия

Для цитирования:


Матвеева А.Р., Антонов Е.В. МЕТОДИКА ФОРМИРОВАНИЯ БАЗЫ ДАННЫХ ХАРАКТЕРИСТИК СЛОЖНОГО ТЕХНОЛОГИЧЕСКОГО ОБЪЕКТА С ИСПОЛЬЗОВАНИЕМ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ. Вестник НИЯУ МИФИ. 2024;13(5):350-357. https://doi.org/10.26583/vestnik.2024.5.7. EDN: PJFXNC

For citation:


Matveeva A.R., Antonov E.V. METHODOLOGY FOR FORMING A DATABASE OF CHARACTERISTICS OF A COMPLEX TECHNOLOGICAL OBJECT USING LARGE LANGUAGE MODELS. Vestnik natsional'nogo issledovatel'skogo yadernogo universiteta "MIFI". 2024;13(5):350-357. (In Russ.) https://doi.org/10.26583/vestnik.2024.5.7. EDN: PJFXNC

Просмотров: 114


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2304-487X (Print)