Model poslovne inteligencije zasnovan na zaključivanju na osnovu slučajeva i izboru mera sličnosti
A model of business inteligence based on case-based reasoning and similatiry measures selection
Doktorand
Vuković, SanjaMentor
Delibašić, BorisČlanovi komisije
Suknović, MilijaRadojević, Dragan
Metapodaci
Prikaz svih podataka o disertacijiSažetak
Predmet istraživanja ove doktorske disertacije je model za klasifikaciju, sa ciljem razvoja modela zasnovanog na zaključivanju na osnovu slučajeva i inteligentnom izboru mera sličnosti, koji će pomoći što precizniju klasifikaciju novih slučajeva.
Cilj je razmotriti da li domensko znanje, koje se može izraziti preko funkcija preferencija, može biti bolje iskorišćeno na takav način da poboljša prediktivne performanse sistema zaključivanja na osnovu slučajeva (ZOS). Dodatno, cilj je utvrditi da li model sa korišćenjem određenih mera sličnosti za kategoričke atribute, u kombinaciji sa korišćenjem funkcija preferencija za numeričke atribute, može dati bolje rezultate od tradicionalnog modela ZOS-a.
Merenje sličnosti između slučajeva je važan deo svakog ZOS modela. Tradicionalno, za merenje sličnosti u modelima ZOS se koristi Euklidova metrika, za numeričke varijable, odnosno funkcija preklapanja za kategoričke atribute. Teorija preferencija se takođe može iskoristiti za merenje sličnosti iz...među slučajeva, naročito što ona pruža više mogućnosti u izražavanju preferencija donosilaca odluka. Dodatno, pokazaće se i rezultati klasifikacije modela u kojima su korišćene određene mera sličnosti za kategoričke atribute, a u kombinaciji sa korišćenjem funkcija preferencija za numeričke atribute.
Rad obuhvata i optimizaciju težina atributa, kao i rezultate predikcione moći modela u zavisnosti od broja nabližih suseda koji se uzimaju u obzir.
Genetski algoritam je korišćen za podešavanje parametara funkcija preferencija, kao i za optimizaciju težina atributa.
Model je testiran na tri različita skupa podataka o klijentima kojima treba razmotriti kreditni zahtev, dok se za procenu učinka prediktivnog modela koristi metodologija
desetostruke unakrsne validacije. Particije unakrsne validacije su se generisale korišćenjem takozvanog semena za slučajni izbor podataka...
The main subject of interest in this doctoral thesis is model of classification, with the common goal of developing a model based on case-based reasoning (CBR) and intelligent selection of similarity measures, which will contribute to a more precise classification of new cases.
It has been interesting to consider whether the domain knowledge, which can be expressed through preference functions, could be better exploited in such a way to improve the predictive performance of a CBR system.
Additionally, the goal is to consider whether the model that using certain similarity measures for categorical data in combination with preference functions for similarity measuring between numerical data, can show better results than the traditional k-NN CBR model.
Similarity measuring between the cases is an important part of each CBR model. Traditionally, in CBR models, for similarity measuring between numerical variables Euclidean metric is used, while for similarity measuring between categorical a...ttributes overlap function is used. Preference theory functions could also be used for similarity measuring between the cases, particularly as they provide more opportunities to express preferences of the decision makers. Additionally, the results of classification models which use certain similarity measures for categorical attributes combined with the use of preference functions for numerical attributes, will be presented in this thesis.
This thesis includes the optimization of attribute weights, as well as the results of models’ predictive power depending on the number of nearest neighbors which are taken into account.
A genetic algorithm is used for setting the parameters of each preference function, as well as to set the attribute weights...