Az Apple szerint nem érdemes a matek leckét AI-jal megoldani

2024.10.18| Phone Arena
Címkék:

Apple

,

AI

,

matek


Az Apple kutatói most megerősítették, hogy a generatív mesterséges intelligencia (AI) logikai hibái különösen a számokkal és a matematikával kapcsolatban jelentkeznek.

Valójában úgy tűnik, hogy az AI nem annyira "okos", mint ahogyan azt gondolnánk, és nem teljesít jól még az alapfokú matematikai feladatok megoldásában sem. Egy új, hat Apple-kutató által publikált tanulmány, amelynek címe "GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models" (GSM-Symbolic: A nagy nyelvi modellek matematikai érvelési korlátainak megértése), azt mutatja, hogy a fejlett nagy nyelvi modellek (LLM) matematikai érvelése pontatlan lehet.

A kutatók a GSM8K nevű adatbázist használták, amely 8 ezer magas minÅ‘ségű, változatos nyelvezetű, alapfokú matematikai feladatot tartalmaz. Ez egy általánosan használt mérÅ‘szám a nyelvi modellek teszteléséhez. A kutatók ezután kissé megváltoztatták a feladatok megfogalmazását, anélkül, hogy a logikán változtattak volna, és ezt nevezték GSM-Symbolic tesztnek.

Az elsÅ‘ tesztsorozatnál a teljesítmény 0,3 és 9,2 százalék közötti csökkenést mutatott. A második sorozat, amelyben a problémák egy részébe olyan állításokat illesztettek, amelyeknek semmi köze nem volt a válaszhoz, "katasztrofális teljesítménycsökkenést" eredményezett, 17,5 százalékról akár 65,7 százalékra is.

Ez sokak számára nem meglepÅ‘. Sokan látták már, hogy az AI egyszerű feladatokkal is küszködik, különösen, ha számokról van szó. Valójában az AI nem igazán oldja meg a matematikai problémákat, hanem inkább egyszerű "mintafelismerést" alkalmaz, anélkül, hogy ténylegesen megértené, mirÅ‘l van szó.

Úgy tűnik, az AI gyakran azért bukik el az egyszerű matematikai feladatok megoldásában, mert a szavak túl bonyolultak vagy nem követik az ismert mintákat. Összességében az AI csupán "érvelés" illúzióját kelti, miközben valójában csak adatokat gyűjt és dolgoz fel.

De mit jelent ez a nagyobb képre nézve? Az utóbbi idÅ‘ben túlságosan is az AI-ra fókuszáltunk, és sokan csodákat várnak tÅ‘le. De komoly korlátai vannak, és nem biztos, hogy ezeket le lehet küzdeni. Kíváncsian várjuk, hogy az AI fejlÅ‘dése hol fog megrekedni (nos, a matematikán kívül!).

 

 

A cikkhez kapcsolódó linkek:


Új és Használt GSM kiemelt ajánlatok


Samsung One UI 9 (Android 17): mely Galaxy készülékek kaphatják meg az új rendszert?

Samsung One UI 9 (Android 17): mely Galaxy készülékek kaphatják meg az új rendszert?

2026.02.16
| Sammyfans
Közeleg az Android 17 alapú frissítés – mutatjuk, mire számíthatnak a Galaxy telefonok és tabletek tulajdonosai.
Csendben mindent megváltoztatott az Apple az iPhone-odon – sokan észre sem veszik ezt az iOS 26 trükköt

Csendben mindent megváltoztatott az Apple az iPhone-odon – sokan észre sem veszik ezt az iOS 26 trükköt

2026.01.16
| 9to5Mac
Az Apple szinte észrevétlenül alakította át az Always On Display működését iOS 26-ban, és a változás teljesen megosztja az iPhone-felhasználókat.
A Sony új telefonjai már most közönségkedvencek – pedig szinte semmit sem tudunk róluk

A Sony új telefonjai már most közönségkedvencek – pedig szinte semmit sem tudunk róluk

2026.02.13
| Phone Arena
A felhasználók elsöprő támogatása esélyt adhat a japán gyártónak az Apple-Samsung duopólium megbontására.
A One UI rejtett audió trükkje, amiről valószínűleg nem is tudtál

A One UI rejtett audió trükkje, amiről valószínűleg nem is tudtál

2026.02.20
| SamMobile
Így működik a „Külön alkalmazáshang” – korlátozott, de hasznos hang-multitasking a Galaxy készülékeken.