Nagy dolgok történnek a város felett a HUN-REN Wigner Fizikai Kutatóközpontban, ami Csillebérc és a Normafa között terül el, és olyan szigorú katonai őrség védi, hogy a belépés halandóknak egyáltalán nem evidencia. De ha sikerül, mintha egy másik városba csöppennénk, város a városban, ahol van bolt, fodrász és főleg nagy koponyák, akik a világ tudományos kérdéseinek megoldásán fáradoznak.
Egy közülük Orbán Gergő, a HUN-REN Wigner Fizikai Kutatóközpont Komputációs Rendszerszintű Idegtudomány „Lendület” Kutatócsoportjának vezetője, aki kollégáival, Csikor Ferenccel, Meszéna Balázzsal és Ócsai Katalinnal egy mesterséges intelligencia modellt használt az emberi látás működésének jobb megértéséhez. Tanulmányuk néhány hete a Nature Communications folyóiratban is megjelent. Orbán Gergőt a kutatásról és az eredmények jelentőségéről faggattuk.
Ahhoz, hogy értelmezni tudjuk környezetünket látás közben, a szemünk által közvetített információn túl egy általános tudásra is szükségünk van, amiben az agy anatómiai felépítésének jut kiemelkedő szerep.
Gépek és neuronok
Az új tanulmányban egy generatív, mély tanulási (deep generative) modellt mutattak be, ami épp ezt, az információ látókérgi feldolgozását modellezte. Orbán Gergőtől megtudjuk, hogy a hierarchikusan szerveződő látókéreg alsóbb területeitől a felsők felé haladva az idegsejtek egyre bonyolultabb információk elemzését végzik. A látókéreghez hasonlóan a látás AI modelljei is hierarchikusan épülnek fel.
A klasszikus mélytanuló modelleknél az információ a feldolgozó rétegeken át kizárólag egy irányba, az alacsonyabbaktól a magasabb szintű „területek” felé áramlik. Ilyenek szolgálják ki a telefonunkban a fotókönyvtárainkat is, ezek segítenek megmondani, hogy egy képen milyen állat néz ránk.
A generatív AI-hoz hasonló eszközök használata az érzékelés kutatásában nem új, a kognitív- és az idegtudományban is vizsgálták a kutatók, hogy a generatív modellek hogyan segítenek megérteni az agy működését. Ám a mélytanuló hálózatok megjelenéséig még nem voltak elegendően komoly generatív modellek, az emberi látórendszer számításaihoz képest csak nagyon leegyszerűsített problémákra tudtak a kutatók modelleket kidolgozni.
Aztán úgy felpörgött az egész, hogy tavaly egy alapvető generatív modell megalkotásáért kapott fizikai Nobel-díjat Geoffrey Hinton, egész pontosan az „alapvető felfedezésekért és találmányokért, amelyek lehetővé teszik a gépi tanulást a mesterséges neurális hálózatok segítségével”.
Orbán Gergőtől megtudjuk azt is, hogy a Deep Learning forradalom mellékágaként jelentek meg a mély generatív modellek, ezeket fejlesztik a kutatócsoportjában az idegrendszer leírására. De miről is van itt szó pontosan?
Támad vagy csak ácsorog?
Retinánkra fotonok érkeznek, amik receptorokat ingerelnek, ez átalakul egy elektromos jellé. Mintha információval telített pixeleket kapnánk meg egy zsákban, és el kell döntenünk, mi legyen velük. Minden pillanatban mérlegelnünk kell, hogy mi a fontos egy adott helyzetben, van-e veszély, hogy kell cselekednünk, ezért sok rétegen keresztül értékeljük a vizuális információt. Az adatok pedig sokféle célra felhasználhatók: néha csak arra vagyunk kíváncsiak, hogy milyen állat néz ránk, máskor azonban azt szeretnénk tudni, hogy éhes-e, vagyis érdemes-e menekülni. S ha úgy ítéljük, hogy igen, nyúlcipőt fel, akkor milyen irányba tud/fog mozdulni az állat.
Ha szembetalálkozunk egy tigrissel, tudattalanul, de megfigyeljük, hogy áll a lába, a teste, hogy kiértékeljük, készül-e támadásra, veszélyes-e ránk nézve. A tigrist beillesztjük a kontextuális információk közé, vagyis hogy egy veszélyes állat, és ha ilyen meg olyan pózban van, akkor biztos, hogy menekülnünk kell. A látórendszer korai területei kisebb és kisebb ablakokon át látnak rá a környezetre. De hogy mit is látnak az ablakon keresztül az egyes idegsejtek, emiatt nagyon bizonytalan: lehet egy tigris lába ugrásra kész vagy csak lazán álldogáló. Ha azonban úgy érzékeljük, hogy a tigris szeme egy prédára szegeződik, akkor az kontextust ad a látottak értelmezéséhez és könnyebb eldönteni azt is, hogy merre fog ugrani.
A teljes cikk megtekintéséhez és tovább olvasásához KATTINTSON IDE!
Forrás:
https://index.hu/tudomany/2026/01/21/orban-gergo-mesterseges-intelligencia-latas-interju/
*Tisztelt Olvasó! Amennyiben a cikk tartalma módosult vagy sértő elemeket tartalmaz, kérjük jelezze számunkra info@net-front.hu e-mail címen!
Hirben.hu Hírben jók vagyunk!