Povećanje razumljivosti modela zasnovanog na pravilima
Increasing the understandability of a rule-based model
Doktorand
Nemet, SandraMentor
Stankovski, StevanČlanovi komisije
Miladinović, LjubomirJovanović, Dragan
Ostojić, Gordana
Tarjan, Laslo
Tegeltija, Srđan
Miladinović, Ljubomir
Stankovski, Stevan
Jovanović, Dragan
Tarjan, Laslo
Tegeltija, Srđan
Stankovski, Stevan
Metapodaci
Prikaz svih podataka o disertacijiSažetak
Tehnike mašinskog učenja imaju brojne primene u tehnici, medicini, bankarstvu i mnogim drugim oblastima. Prisutan je porast potrebe za računarskim metodama koji iz velike količine podataka mogu generisati tačne i razumljive modele. Metode zasnovane na fazi logici su dobro poznat pristup u modelovanju složenih problema. Takagi-Sugeno-Kang (TSK) fazi model zasnovan na pravilima odlikuje visoka tačnost predikcije, međutim njegova razumljivost je slabija u odnosu na Mamdani fazi model. Ova disertacija se bavi istraživanjem i projektovanjem radnog okvira za poboljšavanje razumljivosti TSK fazi modela. TSK fazi pravila se algoritamski kombinuju sa pronađenim asocijativnim pravilima kako bi se poboljšala celokupna razumljivost TSK fazi modela. Podudaranje TSK fazi pravila sa asocijativnim pravilima se zasniva na preklapanju vrednosti atributa asocijativnog pravila i vrednosti odgovarajućih ulazno-izlaznih promenljivih TSK fazi pravila. U toku procesa provere preklapanja promenljivih, promenlj...ive iz asocijativnih pravila su predstavljene kao fazi singltoni. Sve promenljive TSK fazi pravila su aproksimirane Gausovim fazi funkcijama pripadnosti koje su centrirane u odgovarajućim koordinatama centara klastera prostora ulazno-izlaznih varijabli. Postupku agregacije TSK fazi pravila i asocijativnih pravila prethodi faza selekcije obeležja. U tu svrhu je urađena stohastička pretraga multi-dimenzionalnog prostora ulazno-izlaznih varijabli problema kombinovanjem metoda optimizacije jata čestica i višeslojnog perceptrona. Uvođenjem novih komponenti pored TSK fazi modela, razvijeni radni okvir omogućava bolju razumljivost TSK fazi pravila. Takođe, on obezbeđuje jasniju identifikaciju i razumevanje značajnih karakteristika modelovanog sistema ili procesa, kao i skrivenih relacija između njegovih ulaznih obeležja i posledica. Pored jednostavnog uvida u veze među pravilima, radni okvir obezbeđuje procenu važnosti fazi pravila u odnosu prema ostalim pravilima i prema kompletnom TSK fazi modelu. Predloženi radni okvir je razvijen i ilustrovan na problemu analize saobraćajnih nezgoda sa učešćem pešaka. Pomoću njega je omogućeno podrobnije razumevanje razvijenog modela zasnovanog na pravilima, kao i jasnija identifikacija značajnih uzroka saobraćajnih nezgoda.
The amount and diversity of machine learning applications have numerous and diverse applications in different domains, including technology, medicine, finance and so on. There is an enhanced need for computational methods which can generate accurate and interpretable models from big data. Fuzzy logic methods are a well-known approach in modelling of complex problems. Takagi-Sugeno-Kang (TSK) rule-based fuzzy model is characterized by high prediction accuracy, however its interpretability is lesser in comparison to the Mamdani fuzzy model. This PhD thesis deals with the framework design of an easily interpretable TSK fuzzy model. TSK fuzzy rules are algorithmically combined with related association rules in order to improve the overall interpretability of the TSK model. Matching TSK fuzzy rules with association rules is based on attribute values’ overlapping of the association rule and corresponding input-output variables’ value of the TSK fuzzy rule. During the process of variables’ ov...erlapping, variables from association rules are represented as fuzzy singletons. All TSK fuzzy rules variables are approximated with Gaussian fuzzy membership functions, which are centered in corresponding coordinated of cluster centers in the input-output variables’ space. Aggregation of TSK fuzzy and association rules is preceded by features selection phase. Feature selection is performed using a stochastic search procedure of multi-dimensional input-output variables’ space. The stochastic search method represents a hybrid method that combines particle swarm optimization and multi-layer perceptron. By adding new components besides the TSK fuzzy model, the developed framework enables better interpretability of TSK fuzzy rules. It provides a more readable identification and understanding of significant characteristics of modeled system or process, as well as hidden relations between its input features and consequences. Besides a simple insight into the rules’ interconnections of the two rule-based models, the framework provides an assessment of fuzzy rules’ importance in both, and in accordance to other rules and to the complete TSK fuzzy model. The proposed framework is developed and illustrated on the problem of analysis of traffic accidents with pedestrian involvement. It provides a deeper understanding of the built rule-based model, as well as a more readable identification of significant accident causes.