Az Apple szerint nem érdemes a matek leckét AI-jal megoldani

2024.10.18| Phone Arena

Címkék:

Az Apple kutatói most megerősítették, hogy a generatív mesterséges intelligencia (AI) logikai hibái különösen a számokkal és a matematikával kapcsolatban jelentkeznek.

Valójában úgy tÅ±nik, hogy az AI nem annyira "okos", mint ahogyan azt gondolnánk, és nem teljesít jól még az alapfokú matematikai feladatok megoldásában sem. Egy új, hat Apple-kutató által publikált tanulmány, amelynek címe "GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models" (GSM-Symbolic: A nagy nyelvi modellek matematikai érvelési korlátainak megértése), azt mutatja, hogy a fejlett nagy nyelvi modellek (LLM) matematikai érvelése pontatlan lehet.

A kutatók a GSM8K nevÅ± adatbázist használták, amely 8 ezer magas minÅ‘ségÅ±, változatos nyelvezetÅ±, alapfokú matematikai feladatot tartalmaz. Ez egy általánosan használt mérÅ‘szám a nyelvi modellek teszteléséhez. A kutatók ezután kissé megváltoztatták a feladatok megfogalmazását, anélkül, hogy a logikán változtattak volna, és ezt nevezték GSM-Symbolic tesztnek.

Az elsÅ‘ tesztsorozatnál a teljesítmény 0,3 és 9,2 százalék közötti csökkenést mutatott. A második sorozat, amelyben a problémák egy részébe olyan állításokat illesztettek, amelyeknek semmi köze nem volt a válaszhoz, "katasztrofális teljesítménycsökkenést" eredményezett, 17,5 százalékról akár 65,7 százalékra is.

Ez sokak számára nem meglepÅ‘. Sokan látták már, hogy az AI egyszerÅ± feladatokkal is küszködik, különösen, ha számokról van szó. Valójában az AI nem igazán oldja meg a matematikai problémákat, hanem inkább egyszerÅ± "mintafelismerést" alkalmaz, anélkül, hogy ténylegesen megértené, mirÅ‘l van szó.

Úgy tÅ±nik, az AI gyakran azért bukik el az egyszerÅ± matematikai feladatok megoldásában, mert a szavak túl bonyolultak vagy nem követik az ismert mintákat. Összességében az AI csupán "érvelés" illúzióját kelti, miközben valójában csak adatokat gyÅ±jt és dolgoz fel.

De mit jelent ez a nagyobb képre nézve? Az utóbbi idÅ‘ben túlságosan is az AI-ra fókuszáltunk, és sokan csodákat várnak tÅ‘le. De komoly korlátai vannak, és nem biztos, hogy ezeket le lehet küzdeni. Kíváncsian várjuk, hogy az AI fejlÅ‘dése hol fog megrekedni (nos, a matematikán kívül!).

A cikkhez kapcsolódó linkek:

Phone Arena

Számos népszerű Samsung Galaxy készülék kimarad a One UI 9 frissítésből – itt a lista az érintett modellekről

2026.06.30

| Phone Arena

A One UI 9 érkezése új mesterséges intelligencia-funkciókat és továbbfejlesztett kezelőfelületet hoz, azonban több korábbi csúcskategóriás és középkategóriás Galaxy készülék számára ez lesz az út vége.

iPhone 18 bemutató dátum - ekkor rántja le a leplet az Apple az új csúcsmobilokról

2026.06.29

| Phone Arena

A szeptemberi eseményen az iPhone 18 Pro modellek mellett a régóta pletykált hajlítható iPhone Ultra is bemutatkozhat, miközben az áremelésekről szóló találgatások továbbra is beárnyékolják a rajtot.

Az Android rejtett automatizmusai: hat funkció, amely észrevétlenül könnyíti meg a mindennapokat

2026.06.14

| Android Police

Sok felhasználó külön alkalmazásokra esküszik, pedig az Android már évek óta olyan intelligens funkciókat kínál, amelyek maguktól dolgoznak a háttérben.

Az iOS 27 lehet az a frissítés, ami végre iPhone-cserére ösztönzi a felhasználókat

2026.05.29

| 9to5Mac

Az Apple közelgő rendszerfrissítése minden eddiginél jobban az AI-ra építhet, ami sok régebbi iPhone tulajdonost válaszút elé állíthat.