A két egyetem által fejlesztett mesterséges intelligencia alapú beszédhangfeldolgozó alkalmazás működéséről a Semmelweis Egyetem közleményében Kiss Gábor, a BME Távközlési és Médiainformatikai Tanszékének tudományos munkatársa azt mondta, a depressziós betegek beszédének jellegzetességeit tanították meg a szoftvernek egy speciális módszer (Support Vector Regression) segítségével. A Semmelweis oldaláról Hajduska-Dér Bálinttal, az Egyetem Pszichiátriai és Pszichoterápiás Klinikájának tanársegédjével beszélgettünk a kutatás előzményeiről, az eredményekről és a fejlesztés utóéletéről. A fiatal kutató hangsúlyozta, hogy a fejlesztés
nem diagnosztikai eszköz, hanem szűrés, hogy a betegek gyorsabban jussanak terápiába.
A kutatás hátteréről hozzátette:
A BME-vel együttműködésben azt vizsgáltuk, milyen hangtani eltérések vannak, amikből ki lehet szűrni a depressziót. Gépi tanulásos rendszernek táplálták be a depressziós hangmintákat, hogy ő maga találja meg, fennáll-e a betegség lehetősége. A mesterséges intelligencia elkülöníti a hangtani eltéréseket, ami a depressziósokra jellemző, de az egészségesekre nem: lassabb, monoton beszéd több szünettel, kevésbé hangsúlyozott, de ezek szubjektív differenciák, ezt akarták objektivizálni.
A rendszer maga határozza meg az eltéréseket, mi alapján különíti el az egészséges és beteg emberek beszédét. Ahogy Hajduska-Dér Bálint mondta:
A kutatáshoz az úgynevezett Magyar Depressziós Beszéd Adatbázis 218 depressziós és egészséges embertől származó hangmintáját használtuk fel.
A résztvevőknek Az északi szél és a nap című rövid, 10 mondatos mesét kellett felolvasniuk. A szakemberek rögzítették a Beck Depression Inventory (BDI) teszten és a Hamilton Rating Scale for Depression (HAMD) teszten elért pontszámukat is. A betegség felismerésére jelenleg leggyakrabban ezt a két skálát használják, de egyik sem ideális. A BDI ugyan gyors, de önkitöltős, ezért szubjektív, azt tükrözi, hogy maga a páciens hogyan értékeli a saját állapotát. A HAMD tesztet az orvos tölti ki a beteg jelenlétében, ez viszont időigényesebb.
Különböző fizikai jellemzőket vetettek össze minden egyes beszédmintában, köztük a hangspektrumot, a hangdinamikát, a dallamváltozást vagy a beszédritmust.
[…]
A teljes cikk megtekintéséhez és tovább olvasásához KATTINTSON IDE!
*Tisztelt Olvasó! Amennyiben a cikk tartalma módosult vagy sértő elemeket tartalmaz, kérjük jelezze számunkra info@net-front.hu e-mail címen!