Újabb sikereink a Nightingale Open Science nemzetközi adatelemzési versenyen
Az ELTE és a Semmelweis Egyetem között több éve folyó, aktív együttműködés újabb sikert eredményezett Csabai István fizikus professzor kutatócsoportjában. Immár több, mint 5 éves tradíciónak is mondható, hogy a csoportban dolgozó hallgatók, doktoranduszok a kutatásaik során fejlesztett algoritmusokat, adatelemzési készségeiket éles verseny formájában is összemérik a világ bármely kutatócsoportjának eredményeivel.
Az első sikert Ribli Dezső érte el még 2017-ben, amikor a gépi tanulás népszerűvé válásának kezdetén egy mammográfiai elemző algoritmust fejlesztett, és ezzel dobogós helyezést ért el a több ezer résztvevős DREAM Challenge versenyen. Sikerét követték a kompetitív hangulatú csoportban dolgozó társai. Pataki Bálint első helyezést ért el szintén egy DREAM Challenge versenyen, ahol várandós anyák szülési időpontját kellett minél jobban megjósolni. Olar Alex vezetésével egy Covid-megbetegedési súlyosságot felmérő és értelmező eljárás nyert versenyt a tavalyi évben.
Természetesen a versenyeken sosem teljesen egyedül indulnak a versenyzők, de mindig egyikük vállalja a munka koordinálását és az elemzői, fejlesztői munka oroszlánrészét is ő végzi. A fent említett hallgatók sikerei mögött mindig ott álltak a diáktársak, a technikai körülményeket megteremtő oktatók és a témavezetők is. Külön érdemes kiemelni, hogy az egészségügyi témákban elért eredményeket pusztán az adatok elemzésével szinte lehetetlen lenne elérni. A csoport munkáját minden esetben segítik a Semmelweis Egyetem munkatársai, akik konzultációval, adat-értelmezéssel vagy a napi gyakorlatból szerzett tapasztalatokkal segítik a buktatók elkerülését.
A legfrissebb 2023-as versenyeredmény Bedőházi Zsolt, Biricz András és Oz Kilim doktoranduszok munkáját dicséri, több, vezető kutatócsoportot megelőzve végeztek az első helyen. A Nightingale Open Science szervezet által hirdetett különleges verseny szakmai körökben nagy figyelmet keltett. A verseny során
emlődaganatokból készített szöveti minták digitalizált képeit kellett elemezni, és ebből megmondani a betegség stádiumát.
Ez a feladat a jelenleg érvényes eljárási rendek szerint egy nehezen értelmezhető kihívást jelentett. Az emberi elemzés során ugyanis a betegség stádiumát egy komplex elemzési eljárással állapítják meg: klinikai adatokat, vizsgálati eredményeket, biopsziát egyszerre vesznek alapul. Itt azonban csak az emlőből vett szöveti kép állt rendelkezésre.
A gépi látás azonban alapvetően eltérő mechanizmusokkal elemzi a képeket, mint az emberi. Így lehet remény arra, hogy a gép észrevehet olyan mintázatokat, amikre az emberi figyelem az evolúció során nem alakított ki optimális érzékenységet. Várhatóan ez lesz a következő nagy lépés a mesterséges intelligencia alkalmazásában. Csabai István professzor elmondta, a versenyzőknek olyan feladatok megoldását kellett keresnünk, ahol nagyon sok apró információ integrálásával a hagyományos emberi képességeken túl lehet lépni és reménytelenül bonyolult problémákat lehet sikeresen megoldani.
A Nightingale versenyen olyan mennyiségű információt kellene egyetlen egységben látni, amihez aránytalanul sok munkaidőre lenne szüksége egy embernek.
A versenyben elemzett emlőrák szövettani adatbázis több, mint 4200 eset 72000 patológiai metszetét tartalmazta a 2014-2020-as időszakból.
A teljes adathalmaz 130 TB méretű volt. Érzékeltetve a méreteket, ez akkora adatmennyiség, mint 33 millió darab 12 MP-es kamerával készített fotó, vagy 35.000 mozifilm, amit 65.000 óra időtartamban, kb. 8 év alatt lehetne megnézni.
Az elemzett képek alapvető statisztikai tulajdonságai, a különböző színek gyakorisága is ad olyan információt, ami a puszta véletlen tippelésnél jobb eredményt tudott adni. De igazán áttörő eredményt akkor sikerült elérni, amikor egy publikus adatbázis képeinek a segítségével sikerült a versenyben használt neurális hálózatot előkészíteni az adatbázis használatára. A versenyben kitűzött adatbázist ugyanis csak távoli eléréssel, nagyon korlátozott körülmények között lehetett elemezni.
A verseny tanulságai és a sikerélmény motiváló hatásán túl érdemes megemlíteni, hogy a versenyzők létrehoztak egy szoftverkönyvtárat, ami nagyon hatékonyan képes előkészíteni és feldolgozni a gigantikus patológiai képeket. Várhatóan így a hazai egészségügy hétköznapi problémáinak megoldásához is sikeresen hozzá lehet járulni.