Az Apple és az Aalto Egyetem új AI-modellje megérti a...

Az Apple és az Aalto Egyetem új AI-modellje megérti a mobilappok felületeit – bemutatkozik az ILuvUI

2025.07.16| 9to5Mac

Címkék:

Egy új kutatás az Apple és a finn Aalto Egyetem együttműködésében bemutatta az ILuvUI-t, egy olyan látás-nyelvi modellt, amely képes természetes nyelvű utasítások és képernyőképek alapján értelmezni mobilalkalmazások felhasználói felületeit.

A felhasználói felületek (UI) megértése régóta kihívás a mesterséges intelligencia számára. Míg a legtöbb látás-nyelvi modell (Vision-Language Model, VLM) természetes képeken – például állatokon vagy tájakon – tanul, addig az alkalmazások UI-elemei, mint a listaelemek, jelölőnégyzetek vagy szövegmezők sokkal strukturáltabb és összetettebb információt hordoznak.

A ILuvUI (Instruction-tuned LangUage-Vision modeling of UIs from Machine Conversations) célja éppen ez: a szöveges utasításokat és a vizuális adatokat együtt értelmezve pontosabb következtetéseket von le arról, hogyan működik egy alkalmazás felülete. Ehhez a kutatók a nyílt forráskódú LLaVA modellt vették alapul, majd átalakították és finomhangolták, hogy kifejezetten a felhasználói felületek megértésére specializálódjon.

Az Apple és az Aalto Egyetem új AI-modellje megérti a mobilappok felületeit – bemutatkozik az ILuvUI

Az új modellt szintetikusan generált adatkészleten képezték: néhány kézzel válogatott, „arany” mintából gépi módszerekkel hoztak létre nagyszámú kép-szöveg párt, így a modell megtanulhatta, hogyan néz ki egy gomb, egy beviteli mező vagy egy kapcsoló, és hogyan kell ezekről emberi nyelven beszélni.

A kutatás eredményei szerint az ILuvUI jelentősen felülmúlta az alapjául szolgáló VLM teljesítményét, amikor mobilalkalmazások UI-jairól szóló kérdések megválaszolásáról vagy utasítások értelmezéséről volt szó. Ez új lehetőségeket nyit meg a felhasználói felületek automatizálása és az intelligens UI-tesztek területén is.

Böngésszen tovább legfrissebb híreink között!

Az ILuvUI tehát egy újabb lépés afelé, hogy az AI ne csak „lássa”, hanem értse is, hogyan működnek az általunk nap mint nap használt digitális felületek.

A cikkhez kapcsolódó linkek:

9to5mac

Új és Használt GSM kiemelt ajánlatok

Lemásolják a Samsungot? Már jön a privacy kijelző más Android csúcsmodellekbe is

2026.02.23

| 9to5Google

A Galaxy S26 Ultra új Privacy Display kijelzője teljesen új szintre emelheti a mobilos adatvédelmet – és már idén több androidos csúcstelefonban is feltűnhet.

Apple-hatás a Samsungnál? Jön a fejmozdulatos fülhallgató

2026.02.23

| 9to5Google

A Samsung Galaxy Buds 4 Pro fejmozdulatos vezérlést és új gesztusfunkciókat hozhat – és ezzel egyértelműen az Apple babérjaira tör.

Samsung One UI 9 (Android 17): mely Galaxy készülékek kaphatják meg az új rendszert?

2026.02.16

| Sammyfans

Közeleg az Android 17 alapú frissítés – mutatjuk, mire számíthatnak a Galaxy telefonok és tabletek tulajdonosai.

Már gyártják az iPhone 18 Pro-t – de még meglepetést tartogathat az Apple

2026.02.23

| 9to5Mac

Az iPhone 18 Pro már elérte a tesztgyártási fázist – miközben az Apple állítólag még egy kulcsfontosságú döntés előtt áll.

Igen, a tárhely nagyon fontos
Talán, ha más fejlesztések is vannak
Nem, nekem a mostani tárhely is elég
Inkább felhőben tárolok mindent