Negative Deep Learning

Milošević, Nemanja

Negativno duboko učenje

dc.contributor.advisor	Racković, Miloš
dc.contributor.other	Škrbić, Srđan
dc.contributor.other	Racković, Miloš
dc.contributor.other	Radovanović, Miloš
dc.contributor.other	Slivka, Jelena
dc.contributor.other	Lončar, Vladimir
dc.creator	Milošević, Nemanja
dc.date.accessioned	2021-12-17T17:51:42Z
dc.date.available	2021-12-17T17:51:42Z
dc.date.issued	2021-09-27
dc.identifier.uri	https://www.cris.uns.ac.rs/DownloadFileServlet/Disertacija162461355156581.pdf?controlNumber=(BISIS)117902&fileName=162461355156581.pdf&id=17951&source=NaRDuS&language=sr	sr
dc.identifier.uri	https://www.cris.uns.ac.rs/record.jsf?recordId=117902&source=NaRDuS&language=sr	sr
dc.identifier.uri	https://www.cris.uns.ac.rs/DownloadFileServlet/IzvestajKomisije162461357563173.pdf?controlNumber=(BISIS)117902&fileName=162461357563173.pdf&id=17952&source=NaRDuS&language=sr	sr
dc.identifier.uri	https://nardus.mpn.gov.rs/handle/123456789/18837
dc.description.abstract	In recent times the use of Deep Learning as a tool for pattern recognition and more has become essential for many tasks. In critical systems specifically these models are often used in human life affecting environments and that is the reason for new and recent research regarding these models and and their robustness and reliability. In this thesis we explore negative deep learning as a new approach to developing models which have higher performance and more importantly increased robustness compared to normal models used today. Moreover we show how many existing models can be upgraded to employ some kind of negative deep learning without large architectural changes.We will discuss how image classification neural networks (most popular use case of the convolutional neural network family) can be modified to take into consideration missing (negative) features from input samples when making their decisions. We provide deep explanation of the feature negating process, experimenting with different activation functions, neural network layer freezing, Transfer Learning and Fine Tuning approaches, convolutional kernel inversions and more.	en
dc.description.abstract	U današnje vreme upotreba dubokog učenja radi prepoznavanja određenih paterna u podacima postala je nezamenljiv alat u mnogim sistemima. U kritičnim sistemima pogotovo, duboke neuronske mreže se često koriste čak i u scenarijima koji direktno utiču na naše živote. Upravo to je razlog što se u poslednje vreme u istraživanju sve više stavlja akcenat na duboko razumevanje ovih modela i na modele koji su dokazano pouzdani, robusni i sigurni za upotrebu. U ovoj doktorskoj disertaciji istražujemo negativne modele dubokog mašinskog učenja kao novi pristup razvoju modela sa visokim performansama i još važnije sa povećanom robustnošću i pouzdanošću u poređenju sa modelima današnjice. Takođe se bavimo nadogradnjama postojećih modela sa našim negativnim pristupom i pokazujemo kako se postojeći modeli mogu unaprediti bez velikih promena u arhitekturi. Kod modela za klasifikaciju slika (danas najrasprostranjenija primena dubokih konvolutivnih neuronskih mreža) pokazaćemo kako se ovi modeli mogu nadograditi i izmeniti kako bi u obzir uzimali i negativne osobine – one osobine koje znamo da postoje a nisu trenutno prisutne u ulaznim podacima. Za sve modele predstavljene u ovoj disertaciji biće prikazana duboka analiza procesa kao što su negacije osobina, negativne aktivacione funkcije, zamrzavanje slojeva neuronskih mreža, transfer znanja iz jedne mreže u drugu, fine-tuning pristup treniranju, inverzije konvolutivnih filtera i drugo.Dodatno znanje, u obliku negativnog znanja, može biti veoma bitan faktor u učenju i kreaciji modela koji imaju povećanu preciznost, pouzdanost i robustnost, pogotovo u teškim situacijama. Definišemo teške situacije kao one situacije u kojima je model suočen sa podacima koji su izmenjeni ili teži za razumevanje na neki način, bilo na prirodan način ili veštački način. Na primer,modeli predstavljeni u ovom radu su testirani u slučajevima parcijalnih ulaza i okluzija gde su delovi ulaznih podataka odstranjeni ili zaklonjeni na neki način. Negativni modeli u ovakvim situacijama imaju znatno više performanse u poređenju sa običnim, tradicionalnim modelima iste arhitekture. Za veštački generisane situacije, govorićemo o adversarijalnim mrežama, podacima i napadima i kakve su performanse naših negativnih modela kada se suoče sa takvim podacima. Testirani su black-box i white-box adversarijalni napadi i odabrani su oni napadi koji danas predstavljaju najnaprednije moguće metode za namerna kvarenja modela dubokog učenja. U ovoj disertaciji takođe uvodimo pojam mreže sinergije, koja predstavlja spoj normalne i negativne mreže i kao takva se može koristiti i primeniti na bilo koji postojeći model. U sinergiji deo mreže ili cela mreža se dodaje na postojeći model u kombinaciji sa određenim modifikacijama kako bi se uključilo negativno duboko učenje. Pokazaćemo da ovakvi modeli imaju još više performanse u poređenju sa negativnim modelima i eksperimentisaćemo sa raznim načinima spajanja mreža. Model sinergije će biti testiran na CIFAR10 skupu podataka dok su negativni modeli razvijani i testirani na MNIST i EMNIST skupovima podataka. Na kraju, govorićemo o modelima koji koriste "pravo" negativno učenje, a to su oni modeli koji koriste samo negativno znanje za učenje. Biće dat prikaz postojećih sličnih modela kao što su Negative Sampling modeli, Noisy Label Classification modeli i modeli koji koriste Noise Contrastive Estimation. Naš fokus je na dva modela za koje ćemo predložiti i implementirati nadogradnje a to su: negativna Deep Q-Learning agentska neuronska mreža i negativna sijamska Triplet Loss mreža. Oba ova modela mogu biti korišćena uz pomoć samo negativnih podataka, u nekim slučajevima za potpuno treniranje a u nekim slučajevima kao vid regularizacije.	sr
dc.language	en
dc.publisher	Универзитет у Новом Саду, Природно-математички факултет	sr
dc.relation	info:eu-repo/grantAgreement/EC/H2020/780787/EU//
dc.rights	openAccess	en
dc.source	Универзитет у Новом Саду	sr
dc.subject	Artificial Intelligence	en
dc.subject	Veštačka inteligencija	sr
dc.subject	Mašinsko učenje	sr
dc.subject	Duboko učenje	sr
dc.subject	Neuronske mreže	sr
dc.subject	Konvolutivne neuronske mreže	sr
dc.subject	Robustnost	sr
dc.subject	Robustnost neuronskih mreža	sr
dc.subject	Negativno učenje	sr
dc.subject	Machine Learning	en
dc.subject	Deep Learning	en
dc.subject	Neural Networks	en
dc.subject	Convolutional Neural Networks	en
dc.subject	Robustness	en
dc.subject	Neural Network Robustness. Negative Learning	en
dc.title	Negative Deep Learning	en
dc.title.alternative	Negativno duboko učenje	sr
dc.type	doctoralThesis	sr
dc.rights.license	Attribution-NonCommercial-ShareAlike
dcterms.abstract	Рацковић, Милош; Радовановић, Милош; Шкрбић, Срђан; Лончар, Владимир; Сливка, Јелена; Рацковић, Милош; Милошевић, Немања;
dc.identifier.fulltext	http://nardus.mpn.gov.rs/bitstream/id/78455/Disertacija_11965.pdf
dc.identifier.fulltext	http://nardus.mpn.gov.rs/bitstream/id/78456/Izvestaj_komisije_11965.pdf
dc.identifier.rcub	https://hdl.handle.net/21.15107/rcub_nardus_18837

Files in this item

Name:: Disertacija_11965.pdf
Size:: 6.122Mb
Format:: PDF

View/Open

Name:: Izvestaj_komisije_11965.pdf
Size:: 114.3Kb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Природно-математички факултет

Show simple item record