Vedec roka Igor Farkaš: Neurónová sieť rozpozná tvár či objekt, no nemusí im rozumieť

Profesor Igor Farkaš z Katedry aplikovanej informatiky FMFI UK získal ocenenie Vedec roka SR 2023 v kategórii Osobnosť medzinárodnej spolupráce za významné výsledky v oblasti umelej inteligencie, za rozvíjanie spoluprác a medzinárodného magisterského programu kognitívna veda. Vo svojom výskume sa zaoberá umelými neurónovými sieťami, ktoré sa dajú efektívne využiť na riešenie rôznych problémov. Okrem toho tiež koordinuje Centrum pre kognitívnu vedu na Fakulte matematiky, fyziky a informatiky Univerzity Komenského v Bratislave a je hlavným garantom medzinárodného interdisciplinárneho magisterského študijného programu kognitívna veda.


17. 06. 2024 10.11 hod.
Od: Redakcia Našej univerzity

Ako vnímate to, že ste sa stali Osobnosťou medzinárodnej spolupráce?

Aj keď bola cena udelená mne ako jednotlivcovi, prispelo k nej viacero ľudí, ktorí okolo mňa pôsobili, aj pôsobia. Ocenenie som dostal za medzinárodnú spoluprácu s partnermi v oblasti umelých neurónových sietí zo zahraničia. Som veľmi vďačný kolegom z USA, Veľkej Británie, Nemecka, Českej republiky, Slovinska a Rakúska. Okrem toho chcem vyzdvihnúť medzinárodný magisterský študijný program kognitívna veda, ktorého som hlavným garantom.

Popíšte nám, o aký program ide.

V roku 2005 som sa zapojil do európskeho projektu Socrates, ktorého cieľom bolo zaviesť spoločný program kognitívna veda, na ktorom sme spolupracovali s partnermi z Viedne, Ľubľany a z Budapešti. Tento program funguje už od roku 2007. Medzi mojich najbližších spolupracovníkov patria Martin Takáč a Kristína Malinovská z Katedry aplikovanej informatiky FMFI UK. Tento program je unikátny aj v tom, že má dve špeciálne charakteristiky: povinnú mobilitu študentov na zvolenej univerzite konzorcia v treťom semestri a prezentácie výskumu v oboch ročníkoch na konferencii konzorcia MEi:CogSci. Kognitívna veda sa zaoberá výskumom ľudskej mysle, jej podstatou je pochopenie toho, ako funguje ľudská myseľ, ako človek vníma, koná, ako sa rozhoduje. Tiež sa kladú zložité otázky, ako napríklad, čo je vedomie. Ja sa na kognitívne procesy snažím pozerať hlavne z výpočtového hľadiska.

Ako tieto faktory skúmate?

Zjednodušene povedané, v dvoch rovinách – z pohľadu psychológie – psychológovia používajú metódy skúmania so subjektmi, na základe ktorých vzniknú teórie o tom, ako funguje naša myseľ. Okrem toho ich skúmam aj z pohľadu informatiky – myseľ je v mozgu, pričom ide o hmotnú entitu, ktorá vykonáva výpočty na základe vstupov, ktoré dostane. Človek vie rozpoznať nejaký konkrétny objekt na základe výpočtu, prostredníctvom nášho zraku sa dostane informácia do mozgu, ktorý ju spracuje. Takto sme napríklad skúmali raný vývoj jazyka u malých detí pomocou modelovania procesu učenia sa slov. Na tom som pracoval ešte ako postdoktorand v USA.

Máte na to nejaký vzorec, ktorým to počítate?

Nie, skôr ide o vzťah vnímania a jeho prejavov navonok v podobe konania. Inak povedané, ide o matematické zobrazenie, ktoré sa neurónová sieť musí naučiť, rovnako ako sa dieťa v ranom štádiu učí napríklad uchopiť hračku alebo pomenovať ju, keď ju rozpozná.

Máte nejaký príklad, akým spôsobom vieme využiť umelú inteligenciu v kognitívnych vedách?

Napríklad si môžeme predstaviť, že máme k dispozícii počítačový program, ktorý cez kameru nasníma tvár a rozpozná emóciu tým, že ju zaradí do príslušnej kategórie, napríklad šťastie či smútok. Klasický prístup je taký, že program obsahuje pravidlá zamerané na to, ako sa emócie na tvári prejavujú – napríklad ak má človek zdvihnuté kútiky úst, tak sa smeje, ak má vrásky na čele, tak sa mračí a podobne. Na základe týchto príznakov vie program vyhodnotiť danú emóciu. Existuje však aj modernejší a efektívnejší spôsob rozpoznávania, do ktorého sa zapájajú neurónové siete. Systému nemusíme dávať pravidlá, podľa ktorých by mal odpovedať, ale dáme mu zoznam príkladov ľudí s konkrétnou emóciou. Neurónová sieť má príklady z rôznych kategórií a učí sa vzťah medzi tým, čo je na vstupe a tým, čo je na výstupe – teda čo je správna odpoveď.

Odkiaľ by sme mohli získať tieto konkrétne emócie?

Z verejne dostupných databáz sa dajú získať anotované príklady tvárí, ktoré sú zaradené do tried podľa vyjadrených emócií. Na týchto príkladoch je nutné natrénovať neurónovú sieť tak, aby dávala správne odpovede. Pokiaľ nie je natrénovaná, rozhoduje sa náhodne. Trénovanie znamená to, že ak sa sieť pomýli, tak si upraví parametre tak, aby sa viac priblížila k pravde, lebo jej vždy poskytneme správnu odpoveď Zabezpečuje to učiaci algoritmus. Základom všetkých neurónových sietí je učenie, v poslednej dekáde sa veľa hovorí o hlbokom učení.

Projekt Towards excellent robotics and artificiall intelligence at a Slovak University (TERAIS)

Ústrednou témou spoločného výskumu je kognitívna robotika s využitím umelých neurónových sietí a hlbokého učenia, ktoré sú v súčasnosti špičkovými technológiami v oblasti umelej inteligencie. Tento výskum prispeje k vývoju robotov, ktoré budú pre ľudí dôveryhodné a budú s nimi môcť komunikovať na dennej báze. Medzinárodná spolupráca prispeje k vytváraniu sietí a dlhodobých a udržateľných medzinárodných výskumných partnerstiev. Projekt má tiež podporovať prepojenia s ďalšími kľúčovými aktérmi miestneho inovačného ekosystému, ako sú spoločnosti informačných technológií a technologické startupy. Študenti a zamestnanci môžu organizovať spoločné podujatia, webináre či workshopy v rámci projektu.

Projekt má 4 kľúčové piliere: 

rozvoj ľudí,
vytváranie medzinárodných sietí,
excelentný výskum a
podpora výskumu. 

Čo je hlboké učenie?

Ide v podstate o väčšie neurónové siete s viacerými vrstvami neurónov, spôsob ich trénovania je však veľmi podobný ako pri malých sieťach. Vedci majú lepšie možnosti pracovať s neurónovými sieťami ako v minulosti, máme pokročilé nástroje na implementáciu neurónových sietí. Softvér je oveľa lepšie rozvinutý, programovanie sa veľmi zefektívnilo, niekedy stačí len pár riadkov kódu a sieť je pripravená na učenie. Neurónové siete majú viac vrstiev, sú hlboké, takže umožňujú realizovať zložitejšie transformácie a riešiť zložitejšie problémy. Každá vrstva má svoju úlohu a ide o zložitý proces. Je tu podobnosť s ľudským mozgom, ktorý má tiež veľa vrstiev poprepájaných medzi sebou.

Vieme už v súčasnosti, ako funguje ľudská myseľ?

Úplne presne nevieme, ani to podľa mňa nikdy nebudeme vedieť do detailov, lebo nové poznanie vedie k novým otázkam. Skúmanie mysle je zložité, lebo je to nehmotná entita, navyše navonok skrytá. Dá sa skúmať psychologicky, pomocou experimentov. Myseľ však určite závisí od mozgu, a ten je hmotný. Ani ten nepoznáme do detailov. A tu je otázka, na akej úrovni skúmame mozog – či mikroprocesy na neurónoch alebo systémovú úroveň, ako funguje interakcia jednotlivých častí. Tu sa ponúka neurovedný pohľad alebo výpočtové modelovanie procesov prebiehajúcich v mozgu.

Ste koordinátorom medzinárodného twinningového projektu TERAIS, ktorý vznikol v rámci grantového programu EÚ Horizont Európa. Čo sa vám za tie roky fungovania projektu podarilo?

Ide o tretí pokus podávania žiadosti, prvá bola v roku 2018. Na úspešnosti projektu má veľkú zásluhu naša súčasná projektová manažérka Daniela Olejárová, ktorá nám pomohla projekt správne uchopiť a potom napísať. Projekt aj vďaka nej získal maximálny počet bodov. Jeho hlavným cieľom je rozvoj ľudského potenciálu na Katedre aplikovanej informatiky FMFI UK. Snažíme sa podporiť výskum a motivovať kolegyne a kolegov, preto sme vytvorili na katedre oddelenie podpory výskumu. Máme dvoch silných partnerov – Univerzitu v Hamburgu a Taliansky technologický inštitút, s pomocou ktorých tvoríme spoločné odborné publikácie z oblasti umelej inteligencie či realizujeme výskumné pobyty v Hamburgu a Janove.

V projekte TERAIS je zapojená viac ako polovica zamestnancov katedry, ale aj doktorandi a študenti. Chceme robiť lepší výskum ako doteraz, výskumná časť projektu TERAIS sa týka rozvoja umelej inteligencie a robotiky. Mňa konkrétne zaujíma humanoidná robotika, teda roboty podobajúce sa ľuďom, ktoré interagujú s človekom. Už existujú rôzne prototypy, ktoré sa budú ďalej rozvíjať. Rozdiel medzi klasickou umelou inteligenciou v počítači – bez tela – a robotmi je ten, že robot môže konať ako človek a niečo zmeniť, dokáže interagovať s ľuďmi. Je kľúčové zabezpečiť, aby roboty boli bezpečné a spoľahlivé, aby napríklad neohrozili človeka.

Môže umelá inteligencia nejako uškodiť?

Nemalo by sa to stať, iba v prípade, že by sa v hardvéri či softvéri niečo pokazilo. Nové formy umelej inteligencie (UI) sa vedia aj učiť. Otázne je, či sa UI nemôže naučiť niečo negatívne, čo sme my nechceli, aby sa naučila. Predstavme si, že mám systém, pri ktorom je dôležité, aby správne odpovedal. Ak ho správne natrénujeme, tak funguje dobre – napríklad rozpoznáva emócie s vysokou úspešnosťou a podobne. Problémom je to, že súčasná umelá inteligencia na báze neurónových sietí vie fungovať veľmi dobre, no nie je úplne spoľahlivá, pretože je zraniteľná a nie je odolná voči záškodníckym útokom. Napríklad, ak by som cielene modifikoval nasnímaný obraz ľudskej tváre tým, že by som zámerne zmenil zopár bodov (pixelov) na obrázku, tak spôsobím to, že rozpoznávajúca neurónová sieť bude zrazu odpovedať úplne zle, a dokonca s vysokou istotou. Drobné poruchy na obrázku spôsobia, že sieť si myslí niečo úplne iné, dokonca je o tom presvedčená. U človeka sa toto stať nemôže. Náš vizuálny systém funguje na zjavne iných princípoch, ktoré tak ľahko neoklamete.

Máte predstavu, aké opatrenia by sme mali vykonať, aby sa to nedialo?

Jedným zo spôsobov je adversálne trénovanie, teda do normálnych trénovacích dát by sme pridali záškodnícke dáta a budeme dovtedy opravovať parametre siete, kým neposkytne správne výstupy. Ide však len o riešenie symptómov, nie príčiny. Pomôže to vyliečiť sieť z náchylnosti na jeden typ útoku, no týchto útokov je veľa, a vznikajú stále nové. Môžeme umelú inteligenciu natrénovať tak, že bude voči nejakým konkrétnym útokom imúnna, no prídu ďalšie útoky, ktoré nebude poznať. Verím, že sa to však raz podarí systémovo vyriešiť. V súčasnosti dokáže neurónová sieť rozpoznávať tváre či značky, no neznamená to, že im rozumie. Sú to však pre ňu iba obrázky, ktoré rozpoznáva na základe pixelov. Človek si vie predstaviť, ako vyzerá napríklad kôň, t. j. pracovať s mentálnymi konceptuálnymi reprezentáciami. Súčasné neurónové siete s tým majú problém.

Máte nejakú predstavu o tom, akým spôsobom by sme mali túto sieť zmeniť tak, aby nerozpoznávala obrázky iba na základe pixelov?

Môžeme sa inšpirovať napríklad ľudským vizuálnym systémom. Ľudské videnie nie je len tok informácií jedným smerom, ako pri umelej inteligencii. Informácia putuje aj opačným smerom, človek má po vnímaní aj nejaké očakávania. Napríklad, ak vidím psa, tak mám nejaké očakávania o tom, ako by mal vyzerať – mal by mať napríklad štyri nohy a nejaký očakávaný tvar tela. Avšak pokiaľ tieto štyri nohy nevidím, stále viem, že to môže byť pes. Neurónové siete majú aj mechanizmus pozornosti – ak sieť rozpozná objekt, tak to môže byť vďaka častiam obrázku, ktoré sú dôležité pre správnu klasifikáciu, a ktorým venuje pozornosť. Pre nás nie je pozadie objektu obyčajne dôležité, no súčasné modely neurónových siete klasifikujú objekt na obrázku aj na základe pozadia, ktoré považujú za rovnako dôležité.

Radka Rosenbergová