3 milliárd paraméter, 24-szer nagyobb riválisok: brutális AI-megoldást mutatott az Apple

2026.02.21| 9to5Mac

Az Apple új mesterséges intelligenciája, a Ferret-UI Lite mindössze 3 milliárd paraméterrel képes felvenni a versenyt a nála akár 24-szer nagyobb modellekkel – ráadásul közvetlenül az eszközön fut.

Az Apple tovább bővítette a Ferret modellcsaládot egy új, kifejezetten eszközön futtatható változattal. A Ferret-UI Lite mindössze 3 milliárd paraméterből áll, mégis képes hozni – sőt bizonyos esetekben meghaladni – az akár 24-szer nagyobb GUI-ügynök modellek teljesítményét. A cél nem pusztán a hatékonyság volt, hanem az is, hogy a rendszer képes legyen közvetlenül mobilon vagy más eszközön működni, felhőkapcsolat nélkül.

A történet még 2023 decemberében indult, amikor egy kutatócsoport publikálta a FERRET: Refer and Ground Anything Anywhere at Any Granularity című tanulmányt. Az eredeti modell képes volt természetes nyelvi utasítások alapján képrészleteket azonosítani, konkrét vizuális elemekre „rámutatni”, majd azokra hivatkozni. Ez a multimodális nagy nyelvi modell (MLLM) alapozta meg a későbbi fejlesztéseket.

3 milliárd paraméter, 24-szer nagyobb riválisok: brutális AI-megoldást mutatott az Apple

Az Apple ezt követően több továbbfejlesztett verziót is bemutatott: a Ferretv2, a Ferret-UI, valamint a Ferret-UI 2 modelleket. Különösen a Ferret-UI jelentett fontos előrelépést, mivel azt kifejezetten mobil felhasználói felületek (UI) megértésére optimalizálták. A kutatók szerint a hagyományos, általános célú multimodális modellek gyakran alul teljesítenek akkor, amikor konkrét alkalmazásfelületek, ikonok, szövegek vagy kisebb vizuális elemek értelmezése a feladat. A Ferret-UI ezért „any resolution” megközelítéssel nagyította ki a fontos részleteket.

A legújabb változat, a Ferret-UI Lite: Lessons from Building Small On-Device GUI Agents azonban egészen más irányt vett. Míg a korábbi Ferret-UI modellek 13 milliárd paraméteres architektúrára épültek, a Lite verzió csupán 3 milliárdra támaszkodik. Ez drasztikus méretcsökkentés, ami elsőre kompromisszumokkal járna – ám a kutatók szerint a modell így is versenyképes maradt.

3 milliárd paraméter, 24-szer nagyobb riválisok: brutális AI-megoldást mutatott az Apple

A siker egyik kulcsa az úgynevezett valós idejű kivágási és nagyítási technika. A modell először teljes képernyőn készít egy kezdeti predikciót, majd a feltételezett releváns terület köré „kivág”, és ezen a szűkített képrészleten újraértékelést végez. Ez a kétlépcsős folyamat lehetővé teszi, hogy a kisebb modell hatékonyabban dolgozzon a korlátozott számítási kapacitás mellett is, hiszen nem kell egyszerre hatalmas mennyiségű képi tokent feldolgoznia.

A Ferret-UI Lite további érdekessége, hogy részben saját maga generálta a tanítóadatait. A kutatók egy többügynökös rendszert hoztak létre, amely valós GUI-környezetekben (Android, webes és asztali felületeken) hajtott végre feladatokat. Egy „tananyag-generátor” növekvő nehézségű célokat tűzött ki, egy tervező ügynök lépésekre bontotta azokat, egy másik végrehajtotta az akciókat a képernyőn, míg egy kritikus modell értékelte az eredményt. Így a rendszer képes volt a valós interakciók során fellépő hibákat és váratlan állapotokat is megtanulni kezelni.

3 milliárd paraméter, 24-szer nagyobb riválisok: brutális AI-megoldást mutatott az Apple

További friss Telefongurus hírek erre! További friss Telefongurus hírek erre!

Érdekes módon a Lite verziót nem iOS-környezetben, hanem Android, webes és desktop GUI benchmarkokon – például AndroidWorld és OSWorld teszteken – tréningezték és értékelték. Ennek oka valószínűleg az, hogy ezek biztosítanak jelenleg reprodukálható, nagyléptékű tesztkörnyezetet GUI-ügynökök számára.

A teljesítményértékelések szerint a Ferret-UI Lite különösen jól szerepel rövid, alacsony szintű feladatok esetén, például konkrét gombok, ikonok vagy beállítási pontok azonosításában és aktiválásában. Összetett, több lépésből álló műveletek során azonban a kisebb modell méretéből fakadó korlátok már érzékelhetőbbek. Ez ugyanakkor várható kompromisszum egy olyan rendszernél, amelynek elsődleges célja az eszközön belüli futtatás.

3 milliárd paraméter, 24-szer nagyobb riválisok: brutális AI-megoldást mutatott az Apple

A legnagyobb előny így nem csupán a hatékonyság, hanem az adatvédelem: a Ferret-UI Lite lokálisan fut, így a felhasználói adatokat nem kell felhőalapú szerverekre küldeni feldolgozásra. Egy olyan korszakban, amikor a mesterséges intelligencia egyre mélyebben integrálódik az operációs rendszerekbe és alkalmazásokba, ez komoly stratégiai előnyt jelenthet.

Az Apple fejlesztése azt mutatja, hogy a jövő nem feltétlenül a gigantikus, szerveroldali modelleké – hanem az optimalizált, intelligens, eszközön futó ügynököké, amelyek gyorsak, privátak és célzottan specializáltak.

 

 

A cikkhez kapcsolódó linkek:
messenger whatsapp facebook twitter email




Új és Használt GSM kiemelt ajánlatok



Samsung One UI 9 (Android 17): mely Galaxy készülékek kaphatják meg az új rendszert?

Samsung One UI 9 (Android 17): mely Galaxy készülékek kaphatják meg az új rendszert?

2026.02.16
| Sammyfans
Közeleg az Android 17 alapú frissítés – mutatjuk, mire számíthatnak a Galaxy telefonok és tabletek tulajdonosai.
Csendben mindent megváltoztatott az Apple az iPhone-odon – sokan észre sem veszik ezt az iOS 26 trükköt

Csendben mindent megváltoztatott az Apple az iPhone-odon – sokan észre sem veszik ezt az iOS 26 trükköt

2026.01.16
| 9to5Mac
Az Apple szinte észrevétlenül alakította át az Always On Display működését iOS 26-ban, és a változás teljesen megosztja az iPhone-felhasználókat.
A Sony új telefonjai már most közönségkedvencek – pedig szinte semmit sem tudunk róluk

A Sony új telefonjai már most közönségkedvencek – pedig szinte semmit sem tudunk róluk

2026.02.13
| Phone Arena
A felhasználók elsöprő támogatása esélyt adhat a japán gyártónak az Apple-Samsung duopólium megbontására.
Egy év a Galaxy S25 Ultrával: ezért kell nagyot lépnie a Galaxy S26 Ultrának

Egy év a Galaxy S25 Ultrával: ezért kell nagyot lépnie a Galaxy S26 Ultrának

2026.02.13
| Android Police
Dizájn, kamera, töltés és valóban hasznos AI – ezekben várható az előrelépés.

TELEFONOK GYORSLISTA
Márka :

Tipus :


HÍRLEVÉL

Feliratkozás a Telefonguru ingyenes hírlevelére

Elfogadom az Adatvédelmi és Adatkezelési Tájékoztatót Ezt a webhelyet a reCAPTCHA védi. A Google adatvédelmi irányelve és a szolgáltatási feltételek érvényesek.


SZAVAZÁS

Használja a telefonja AI-alapú fotószerkesztő funkcióit (pl. tárgyak eltávolítása, Magic Eraser, háttércsere)?


Igen, rendszeresen használom
Igen, alkalmanként kipróbálom
Tudok róla, de nem használom
Nem tudom, milyen funkciók ezek
Inkább a hagyományos fotókat kedvelem



Korábbi szavazások eredményei