![]() | Cím: Elsőrendű logika és generatív mesterséges intelligencia Szerző: Vályi Sándor Kiadó neve: Nyíregyházi Egyetem, Matematika és Informatika Intézet DOI: https://doi.org/10.71066/VARECZA.2025.1.04 Megjelenés: 2025. december Letöltés / Megtekintés (PDF): letöltés |
Összefoglaló:
Az elsőrendű logika a formális ismeret-reprezentációs és következtetési rendszerek történetileg legfontosabb és legbefolyásosabb tagja. Ma is az első helyen szerepel a legismertebb mesterséges intelligencia tankönyv ismeret-reprezentációs eszközei között. Természetesen az elsőrendű logika érvelési formalizmusa és az automatikus következménybizonyító algoritmusai nagy hatást gyakoroltak a mai generatív mesterséges intelligencia-kutatások menetére. Jelen írásban összehasonlítjuk a 2023-as ChatGPT-3.5 és a 2025-ben (november elején) általánosan elérhető ChatGPT-5 verzió néhány, az elsőrendű logikával kapcsolatos képességét, mintegy vizsgáztatás alá vetjük, mint egy elsőéves programtervező informatikus vagy matematikus hallgatót. Megállapítjuk, hogy az elsőrendű logikával kapcsolatos szintaktikai ismeretei rendben voltak már 2023-ban is. A formális levezetések keresésével kapcsolatos képessége is fejlett volt már akkor. Megállapítottuk, hogy a természetes nyelven megfogalmazott következtetésekben az elmúlt két év alatt nagyon sokat fejlődött, a 'reasoning' fontos szerepet kapott a ChatGPT újabb modelljeinek fejlesztéseiben, tulajdonképpen a fejlesztések egyik fő irányát jelenti.
Kulcsszavak: mesterséges intelligencia, generatív MI, elsőrendű logika, formális következtetés, természetes nyelvi következtetés
Abstract:
First-order logic is historically the most important and influential member of formal knowledge representation and inference systems. It still ranks first among the knowledge representation tools of the most well-known artificial intelligence textbook. Of course, the reasoning formalism of first-order logic and its automatic deduction algorithms have had a great impact on the course of today's generative artificial intelligence research. In this paper, we compare some of the first-order logic-related capabilities of the 2023 ChatGPT-3.5 and the ChatGPT-5 version, which will be generally available in 2025 (early November), and put them to the test, as if they were a first-year computer science or mathematics student. We conclude that their syntactic knowledge of first-order logic was already ok in 2023. Their ability to search for formal derivations was also developed well at that time. We have found that inferences formulated in natural language have improved a lot over the past two years. 'Reasoning' has played an important role in the development of the newer ChatGPT models, in fact it represents one of the main directions of development..
Felhasznált szakirodalom:
HIVATKOZOTT WEBODALAK
[VS2023] ZFC for Everyday Math, web history of the conversation with chatGPT-3.5, Vályi Sándor,
https://chatgpt.com/share/692cc27a-f8f8-8011-a3b9-bb55675ef3c3 Készítve: 2023. májusában
[VS2025] ZF and PA consistency, web history of the conversation with chatGPT-5, Vályi Sándor,
https://chatgpt.com/share/692cc30d-0eb8-8011-8862-1a9b76ef8c58 Készítve: 2025. novemberében
[ZEFF2025] Maxwell Zeff: OpenAI launches a pair of AI reasoning models, o3 and o4-mini, web article, https://techcrunch.com/2025/04/16/openai-launches-a-pair-of-ai-reasoning-models-o3-and-o4-mini, April 16, 2025. megtekintve: 2025.11.01
HIVATKOZOTT PREPRINTEK
[LIU2023] Liu, H., Ning, R., Teng, Z., Liu, J., Zhou, Q., & Zhang, Y.: Evaluating the logical reasoning ability of chatgpt and gpt-4. arXiv preprint arXiv:2304.03439. (2023)
HIVATKOZOTT KÖNYVEK
[RN2022] Russell, S., Norvig, P.: Artificial intelligence a Modern Approach, 4th ed, Pearson, (2022), ISBN 978-1-292-40113-3
FELHASZNÁLT SZAKIRODALOM
[PATEL2024] Patel, N., Kulkarni, M., Parmar, M., Budhiraja, A., Nakamura, M., Varshney, N., & Baral, C.: Multi-logieval: Towards evaluating multi-step logical reasoning ability of large language models. arXiv preprint arXiv:2406.17169. (2024)
https://doi.org/10.18653/v1/2024.emnlp-main.1160
[WAN2024] Wan, Y., Wang, W., Yang, Y., Yuan, Y., Huang, J. T., He, P., ... & Lyu, M.: LogicAsker: Evaluating and improving the logical reasoning ability of large language models. In: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing (pp. 2124-2155). (2024 November)
https://doi.org/10.18653/v1/2024.emnlp-main.128
