Az Apple szerint nem érdemes a matek leckét AI-jal megoldani

2024.10.18| Phone Arena
Címkék:

Apple

,

AI

,

matek


Az Apple kutatói most megerősítették, hogy a generatív mesterséges intelligencia (AI) logikai hibái különösen a számokkal és a matematikával kapcsolatban jelentkeznek.

Valójában úgy tűnik, hogy az AI nem annyira "okos", mint ahogyan azt gondolnánk, és nem teljesít jól még az alapfokú matematikai feladatok megoldásában sem. Egy új, hat Apple-kutató által publikált tanulmány, amelynek címe "GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models" (GSM-Symbolic: A nagy nyelvi modellek matematikai érvelési korlátainak megértése), azt mutatja, hogy a fejlett nagy nyelvi modellek (LLM) matematikai érvelése pontatlan lehet.

A kutatók a GSM8K nevű adatbázist használták, amely 8 ezer magas minÅ‘ségű, változatos nyelvezetű, alapfokú matematikai feladatot tartalmaz. Ez egy általánosan használt mérÅ‘szám a nyelvi modellek teszteléséhez. A kutatók ezután kissé megváltoztatták a feladatok megfogalmazását, anélkül, hogy a logikán változtattak volna, és ezt nevezték GSM-Symbolic tesztnek.

Az elsÅ‘ tesztsorozatnál a teljesítmény 0,3 és 9,2 százalék közötti csökkenést mutatott. A második sorozat, amelyben a problémák egy részébe olyan állításokat illesztettek, amelyeknek semmi köze nem volt a válaszhoz, "katasztrofális teljesítménycsökkenést" eredményezett, 17,5 százalékról akár 65,7 százalékra is.

Ez sokak számára nem meglepÅ‘. Sokan látták már, hogy az AI egyszerű feladatokkal is küszködik, különösen, ha számokról van szó. Valójában az AI nem igazán oldja meg a matematikai problémákat, hanem inkább egyszerű "mintafelismerést" alkalmaz, anélkül, hogy ténylegesen megértené, mirÅ‘l van szó.

Úgy tűnik, az AI gyakran azért bukik el az egyszerű matematikai feladatok megoldásában, mert a szavak túl bonyolultak vagy nem követik az ismert mintákat. Összességében az AI csupán "érvelés" illúzióját kelti, miközben valójában csak adatokat gyűjt és dolgoz fel.

De mit jelent ez a nagyobb képre nézve? Az utóbbi idÅ‘ben túlságosan is az AI-ra fókuszáltunk, és sokan csodákat várnak tÅ‘le. De komoly korlátai vannak, és nem biztos, hogy ezeket le lehet küzdeni. Kíváncsian várjuk, hogy az AI fejlÅ‘dése hol fog megrekedni (nos, a matematikán kívül!).

 

 

A cikkhez kapcsolódó linkek:


Új és Használt GSM kiemelt ajánlatok


Megvan a dátum! További 20 Galaxyra erősítették meg a One UI 8.5 frissítést

Megvan a dátum! További 20 Galaxyra erősítették meg a One UI 8.5 frissítést

2026.05.08
| SammyFans
A Galaxy S, Z, A és Tab szériák újabb modelljei csatlakoznak a nagy rendszerfrissítéshez.
Rejtett ujjlenyomat trükk a Samsung telefonokon

Rejtett ujjlenyomat trükk a Samsung telefonokon

2026.04.08
| Android Authority
Egy kevéssé ismert funkcióval teljesen új szintre emelhető a vezérlés a Samsungokon.
Forradalmi egészségügyi funkció jöhet a Samsung Galaxy Watch okosórákba

Forradalmi egészségügyi funkció jöhet a Samsung Galaxy Watch okosórákba

2026.05.10
| SamMobile
A Samsung órái akár percekkel előre jelezhetik az ájulást egy új mesterséges intelligenciás fejlesztéssel.
Közel a végleges frissítés: így áll a One UI 8.5 és a One UI 9

Közel a végleges frissítés: így áll a One UI 8.5 és a One UI 9

2026.05.04
| SammyFans
Samsung szoftver fronton: hamarosan indul a stabil verzió, a béta is a küszöbön.