Az Apple és az Aalto Egyetem új AI-modellje megérti a mobilappok felületeit – bemutatkozik az ILuvUI

2025.07.16| 9to5Mac

Egy új kutatás az Apple és a finn Aalto Egyetem együttműködésében bemutatta az ILuvUI-t, egy olyan látás-nyelvi modellt, amely képes természetes nyelvű utasítások és képernyőképek alapján értelmezni mobilalkalmazások felhasználói felületeit.

A felhasználói felületek (UI) megértése régóta kihívás a mesterséges intelligencia számára. Míg a legtöbb látás-nyelvi modell (Vision-Language Model, VLM) természetes képeken – például állatokon vagy tájakon – tanul, addig az alkalmazások UI-elemei, mint a listaelemek, jelölőnégyzetek vagy szövegmezők sokkal strukturáltabb és összetettebb információt hordoznak.

A ILuvUI (Instruction-tuned LangUage-Vision modeling of UIs from Machine Conversations) célja éppen ez: a szöveges utasításokat és a vizuális adatokat együtt értelmezve pontosabb következtetéseket von le arról, hogyan működik egy alkalmazás felülete. Ehhez a kutatók a nyílt forráskódú LLaVA modellt vették alapul, majd átalakították és finomhangolták, hogy kifejezetten a felhasználói felületek megértésére specializálódjon.

Az Apple és az Aalto Egyetem új AI-modellje megérti a mobilappok felületeit – bemutatkozik az ILuvUI

Az új modellt szintetikusan generált adatkészleten képezték: néhány kézzel válogatott, „arany” mintából gépi módszerekkel hoztak létre nagyszámú kép-szöveg párt, így a modell megtanulhatta, hogyan néz ki egy gomb, egy beviteli mező vagy egy kapcsoló, és hogyan kell ezekről emberi nyelven beszélni.

A kutatás eredményei szerint az ILuvUI jelentősen felülmúlta az alapjául szolgáló VLM teljesítményét, amikor mobilalkalmazások UI-jairól szóló kérdések megválaszolásáról vagy utasítások értelmezéséről volt szó. Ez új lehetőségeket nyit meg a felhasználói felületek automatizálása és az intelligens UI-tesztek területén is.

Böngésszen tovább legfrissebb híreink között! Böngésszen tovább legfrissebb híreink között!

Az ILuvUI tehát egy újabb lépés afelé, hogy az AI ne csak „lássa”, hanem értse is, hogyan működnek az általunk nap mint nap használt digitális felületek.

 

 

A cikkhez kapcsolódó linkek:
messenger whatsapp facebook twitter email




Új és Használt GSM kiemelt ajánlatok



Lemásolják a Samsungot? Már jön a privacy kijelző más Android csúcsmodellekbe is

Lemásolják a Samsungot? Már jön a privacy kijelző más Android csúcsmodellekbe is

2026.02.23
| 9to5Google
A Galaxy S26 Ultra új Privacy Display kijelzője teljesen új szintre emelheti a mobilos adatvédelmet – és már idén több androidos csúcstelefonban is feltűnhet.
Apple-hatás a Samsungnál? Jön a fejmozdulatos fülhallgató

Apple-hatás a Samsungnál? Jön a fejmozdulatos fülhallgató

2026.02.23
| 9to5Google
A Samsung Galaxy Buds 4 Pro fejmozdulatos vezérlést és új gesztusfunkciókat hozhat – és ezzel egyértelműen az Apple babérjaira tör.
Samsung One UI 9 (Android 17): mely Galaxy készülékek kaphatják meg az új rendszert?

Samsung One UI 9 (Android 17): mely Galaxy készülékek kaphatják meg az új rendszert?

2026.02.16
| Sammyfans
Közeleg az Android 17 alapú frissítés – mutatjuk, mire számíthatnak a Galaxy telefonok és tabletek tulajdonosai.
Már gyártják az iPhone 18 Pro-t – de még meglepetést tartogathat az Apple

Már gyártják az iPhone 18 Pro-t – de még meglepetést tartogathat az Apple

2026.02.23
| 9to5Mac
Az iPhone 18 Pro már elérte a tesztgyártási fázist – miközben az Apple állítólag még egy kulcsfontosságú döntés előtt áll.

TELEFONOK GYORSLISTA
Márka :

Tipus :


HÍRLEVÉL

Feliratkozás a Telefonguru ingyenes hírlevelére

Elfogadom az Adatvédelmi és Adatkezelési Tájékoztatót Ezt a webhelyet a reCAPTCHA védi. A Google adatvédelmi irányelve és a szolgáltatási feltételek érvényesek.


SZAVAZÁS

Megérné Önnek telefont váltani csak azért, mert az új modell dupla alap tárhellyel érkezik?


Igen, a tárhely nagyon fontos
Talán, ha más fejlesztések is vannak
Nem, nekem a mostani tárhely is elég
Inkább felhőben tárolok mindent



Korábbi szavazások eredményei