Show simple item record

Negativno duboko učenje

dc.contributor.advisorRacković, Miloš
dc.contributor.otherŠkrbić, Srđan
dc.contributor.otherRacković, Miloš
dc.contributor.otherRadovanović, Miloš
dc.contributor.otherSlivka, Jelena
dc.contributor.otherLončar, Vladimir
dc.creatorMilošević, Nemanja
dc.date.accessioned2021-12-17T17:51:42Z
dc.date.available2021-12-17T17:51:42Z
dc.date.issued2021-09-27
dc.identifier.urihttps://www.cris.uns.ac.rs/DownloadFileServlet/Disertacija162461355156581.pdf?controlNumber=(BISIS)117902&fileName=162461355156581.pdf&id=17951&source=NaRDuS&language=srsr
dc.identifier.urihttps://www.cris.uns.ac.rs/record.jsf?recordId=117902&source=NaRDuS&language=srsr
dc.identifier.urihttps://www.cris.uns.ac.rs/DownloadFileServlet/IzvestajKomisije162461357563173.pdf?controlNumber=(BISIS)117902&fileName=162461357563173.pdf&id=17952&source=NaRDuS&language=srsr
dc.identifier.urihttps://nardus.mpn.gov.rs/handle/123456789/18837
dc.description.abstractIn recent times the use of Deep Learning as a tool for pattern recognition and more has become essential for many tasks. In critical systems specifically these models are often used in human life affecting environments and that is the reason for new and recent research regarding these models and and their robustness and reliability. In this thesis we explore negative deep learning as a new approach to developing models which have higher performance and more importantly increased robustness compared to normal models used today. Moreover we show how many existing models can be upgraded to employ some kind of negative deep learning without large architectural changes.We will discuss how image classification neural networks (most popular use case of the convolutional neural network family) can be modified to take into consideration missing (negative) features from input samples when making their decisions. We provide deep explanation of the feature negating process, experimenting with different activation functions, neural network layer freezing, Transfer Learning and Fine Tuning approaches, convolutional kernel inversions and more.en
dc.description.abstractU današnje vreme upotreba dubokog učenja radi prepoznavanja određenih paterna u podacima postala je nezamenljiv alat u mnogim sistemima. U kritičnim sistemima pogotovo, duboke neuronske mreže se često koriste čak i u scenarijima koji direktno utiču na naše živote. Upravo to je razlog što se u poslednje vreme u istraživanju sve više stavlja akcenat na duboko razumevanje ovih modela i na modele koji su dokazano pouzdani, robusni i sigurni za upotrebu. U ovoj doktorskoj disertaciji istražujemo negativne modele dubokog mašinskog učenja kao novi pristup razvoju modela sa visokim performansama i još važnije sa povećanom robustnošću i pouzdanošću u poređenju sa modelima današnjice. Takođe se bavimo nadogradnjama postojećih modela sa našim negativnim pristupom i pokazujemo kako se postojeći modeli mogu unaprediti bez velikih promena u arhitekturi. Kod modela za klasifikaciju slika (danas najrasprostranjenija primena dubokih konvolutivnih neuronskih mreža) pokazaćemo kako se ovi modeli mogu nadograditi i izmeniti kako bi u obzir uzimali i negativne osobine – one osobine koje znamo da postoje a nisu trenutno prisutne u ulaznim podacima. Za sve modele predstavljene u ovoj disertaciji biće prikazana duboka analiza procesa kao što su negacije osobina, negativne aktivacione funkcije, zamrzavanje slojeva neuronskih mreža, transfer znanja iz jedne mreže u drugu, fine-tuning pristup treniranju, inverzije konvolutivnih filtera i drugo.Dodatno znanje, u obliku negativnog znanja, može biti veoma bitan faktor u učenju i kreaciji modela koji imaju povećanu preciznost, pouzdanost i robustnost,  pogotovo u teškim situacijama. Definišemo teške situacije kao one situacije u kojima je model suočen sa podacima koji su izmenjeni ili teži za razumevanje na neki način, bilo na prirodan način ili veštački način. Na primer,modeli predstavljeni u ovom radu su testirani u slučajevima parcijalnih ulaza i okluzija gde su delovi ulaznih podataka  odstranjeni ili zaklonjeni na neki način. Negativni modeli u ovakvim situacijama imaju znatno više performanse u poređenju sa običnim, tradicionalnim modelima iste arhitekture. Za veštački generisane situacije, govorićemo o adversarijalnim mrežama, podacima i napadima i kakve su performanse naših negativnih modela kada se suoče sa takvim podacima. Testirani su black-box i white-box adversarijalni napadi i odabrani su oni napadi koji danas predstavljaju najnaprednije moguće metode za namerna kvarenja modela dubokog učenja. U ovoj disertaciji takođe uvodimo pojam mreže sinergije, koja predstavlja spoj normalne i negativne mreže i kao takva se može koristiti i primeniti na bilo koji postojeći model. U sinergiji deo mreže ili cela mreža se dodaje na postojeći model u kombinaciji sa određenim modifikacijama kako bi se uključilo negativno duboko učenje. Pokazaćemo da ovakvi modeli imaju još više performanse u poređenju sa negativnim modelima i eksperimentisaćemo sa raznim načinima spajanja mreža. Model sinergije će biti testiran na CIFAR10 skupu podataka dok su negativni modeli razvijani i testirani na MNIST i EMNIST skupovima podataka. Na kraju, govorićemo o modelima koji koriste "pravo" negativno učenje, a to su oni modeli koji koriste samo negativno znanje za učenje. Biće dat prikaz postojećih sličnih modela kao što su Negative Sampling modeli, Noisy Label Classification modeli i modeli koji koriste Noise Contrastive Estimation. Naš fokus je na dva modela za koje ćemo predložiti i implementirati nadogradnje a to su: negativna Deep Q-Learning agentska neuronska mreža i negativna sijamska Triplet Loss mreža. Oba ova modela mogu biti korišćena uz pomoć samo negativnih podataka, u nekim slučajevima za potpuno treniranje a u nekim slučajevima kao vid regularizacije.sr
dc.languageen
dc.publisherУниверзитет у Новом Саду, Природно-математички факултетsr
dc.relationinfo:eu-repo/grantAgreement/EC/H2020/780787/EU//
dc.rightsopenAccessen
dc.sourceУниверзитет у Новом Садуsr
dc.subjectArtificial Intelligenceen
dc.subjectVeštačka inteligencijasr
dc.subjectMašinsko učenjesr
dc.subjectDuboko učenjesr
dc.subjectNeuronske mrežesr
dc.subjectKonvolutivne neuronske mrežesr
dc.subjectRobustnostsr
dc.subjectRobustnost neuronskih mrežasr
dc.subjectNegativno učenjesr
dc.subjectMachine Learningen
dc.subjectDeep Learningen
dc.subjectNeural Networksen
dc.subjectConvolutional Neural Networksen
dc.subjectRobustnessen
dc.subjectNeural Network Robustness. Negative Learningen
dc.titleNegative Deep Learningen
dc.title.alternativeNegativno duboko učenjesr
dc.typedoctoralThesissr
dc.rights.licenseAttribution-NonCommercial-ShareAlike
dcterms.abstractРацковић, Милош; Радовановић, Милош; Шкрбић, Срђан; Лончар, Владимир; Сливка, Јелена; Рацковић, Милош; Милошевић, Немања;
dc.identifier.fulltexthttp://nardus.mpn.gov.rs/bitstream/id/78455/Disertacija_11965.pdf
dc.identifier.fulltexthttp://nardus.mpn.gov.rs/bitstream/id/78456/Izvestaj_komisije_11965.pdf
dc.identifier.rcubhttps://hdl.handle.net/21.15107/rcub_nardus_18837


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record