UNIVERZITET U BEOGRADU EKONOMSKI FAKULTET KOSOVKA Đ. OGNJENOVIĆ ANALIZA RAZLIKA U ZARADAMA I VIŠESTRUKOG IZBORA ZAPOSLENJA PRIMENOM PARAMETARSKIH I POLUPARAMETARSKIH EKONOMETRIJSKIH METODA PANELA DOKTORSKA DISERTACIJA BEOGRAD  2018 UNIVERSITY OF BELGRADE FACULTY OF ECONOMICS KOSOVKA Đ. OGNJENOVIĆ AN ANALYSIS OF WAGE DIFFERENCES AND MULTIPLE JOB HOLDING BY USING PARAMETRIC AND SEMIPARAMETRIC ECONOMETRIC METHODS FOR PANEL DATA DOCTORAL DISERTATION BELGRADE  2018 Analiza razlika u zaradama i višestrukog izbora zaposlenja iii MENTOR: prof. dr Radmila Dragutinović Mitrović, redovni profesor Univerzitet u Beogradu, Ekonomski fakultet _______________________________________________ ČLANOVI KOMISJE: prof. dr Mihail Arandarenko, redovni profesor, Univerzitet u Beogradu, Ekonomski fakultet _______________________________________________ prof. dr Slobodan Cvejić, redovni profesor, Univerzitet u Beogradu, Filozofski fakultet _______________________________________________ Datum odbrane: ______________ Datum promocije: ______________ Analiza razlika u zaradama i višestrukog izbora zaposlenja iv Zahvalnost Mojim roditeljima Analiza razlika u zaradama i višestrukog izbora zaposlenja v Analiza razlika u zaradama i višestrukog izbora zaposlenja primenom parametarskih i poluparametarskih ekonometrijskih metoda panela Rezime Predmet razmatranja u doktorskoj disertaciji jesu rodne razlike u zaradama i sklonost izbora više od jednog posla, kao prakse tržišta rada koje postaju naročito vidljive u prvim godinama tranzicije. Ove prakse su karakteristične za sve privredne sisteme, a ne samo za zemlje u tranziciji. Međutim, njihov obim i struktura variraju u zavisnosti od dinamike prilagođavanja faktora koji utiču na funkcionisanje tržišta rada. Stoga je praćenje ovih praksi važno, budući da mogu imati šire implikacije na socijalnu i ekonomsku politiku zemalja u tranziciji. Njihova analiza u doktorskoj disertaciji odnosi se na period intenziviranja procesa privatizacije u Srbiji sa početka 2000-ih godina i završava se periodom kada su počeli da se uočavaju prvi pozitivni efekti strukturnih reformi koji su zatim usporeni ekonomskom krizom iz 2008. godine. Testirane su dve osnovne istraživačke hipoteze: (i) da li postoje statistički značajne razlike u zaradama između muškaraca i žena i da li se te razlike jednim delom mogu objasniti uticajem diskriminacione prakse u određivanju zarada, (ii) kao i da li sklonost izbora više od jednog posla zavisi od zarade i časova rada na osnovnom poslu, očekivane zarade od dodatnog zaposlenja, te od ostalih determinanti koje utiču na odluku pojedinca da se istovremeno angažuje na više poslova. Obe hipoteze su empirijski potvrđene. Informacionu osnovu čine podaci Ankete o životnom standardu na bazi koje je formirana serija panel podataka za 2002. i 2003. godinu, kao i serija uporednih podataka za 2007. godinu. Polazeći od činjenice da se stope aktivnosti i zaposlenosti muškaraca i žena značajno razlikuju, rodni jaz u zaradama je posmatran uzimajući u obzir selekciju zaposlenih u sektor zarada. Rodni jaz je najpre izračunat na bazi modela izbora podataka za uporedne podatke ocenjenog metodom maksimalne verodostojnosti. Prema ovom metodu, ocenjeni rodni jaz se smanjio sa 10,96% na 5,97% tokom posmatranog perioda. U drugom koraku, rodni jaz je ocenjen na bazi poluparametarskog modela izbora podataka sa neparametarskom korekcijom pristrasnosti usled neslučajnog izbora pojedinca da radi za platu. Testirane su razlike u strukturi zarada ocenjene primenom parametarskog i poluparametarskog modela izbora podataka i zaključeno je da parametarska specifikacija odgovara modelu zarada. Treći metod koristi kovarijacioni metod ocenjivanja funkcije zarada u formi modela fiksnih efekata. Ovaj metod je potvrdio prisustvo statističke diskriminacije u određivanju zarada žena. Četvrti metod koristi kvantilne regresije u dekompoziciji rodnih razlika duž raspodele zarada. Primena ovog metoda dala je za rezultat veće rodne razlike na donjem levom delu raspodele (17,44%) a manje na desnom gornjem delu raspodele (9,12%), potvrđujući prisustvo efekta klizavog poda. Na kraju je ocenjen probit model sa slučajnim efektima, čije ocene su pokazale da je odluka da se neko opredeli za dodatni posao snažno finansijski motivisana, tj. da zarada od osnovnog posla smanjuje verovatnoću izbora za 20,8%, a očekivana zarada od dodatnog posla je poveća za 0,6%. Doprinos doktorske disertacije ogleda se u tome što se u njoj prvi put celovito analiziraju rodne razlike u zaradama u srednjoj vrednosti i na različitim kvantilima raspodele zarada svih zaposlenih u Srbiji tokom perioda intenzivnih strukturnih reformi. U analizi ovih praksi korišćeni su parametarski i poluparametarski modeli i ekonometrijske tehnike ocenjivanja za uporedne podatke i podatke panela. U disertaciji se razmatraju karakteristike zaposlenih koji pored osnovnog imaju i dodatno zaposlenje, i ocenjuju determinante koje utiču na verovatnoću istovremenog izbora više od jednog posla. Rezultati ove analize su dobijeni primenom nekoliko uporednih metodoloških pristupa i ukazuju na značajno prisustvo neobjašnjenog rodnog jaza u zaradama koji sadrži i skrivenu komponentu diskriminacije, kao i na značajnost faktora koji utiču na verovatnoću izbora dodatnog posla, pre svega, u neformalnom sektoru. Ključni nalazi analize sugerišu da fokus javnih politika treba usmeriti na one institucije koje mogu da osnaže pregovaračku poziciju žena i doprinesu suzbijanju neformalnih praksi na tržištu rada Srbije. Ključne reči: ekonometrijski metodi, funkcija zarada, izbor dodatnog posla, mikro panel, model izbora podataka, poluparametarsko ocenjivanje, probit model sa slučajnim efektima, rodne razlike u zaradama. Naučna oblast: Društvene nauke, ekonomija Uža naučna oblast: Ekonomija rada i primenjena ekonometrija JEL Klasifikacija: C33, C34, J22, J24, J31, J71 UDK: 331.5:519.862(043.3); 005.337:519.862(043.3) Analiza razlika u zaradama i višestrukog izbora zaposlenja vi An analysis of wage differences and multiple job holding by using parametric and semiparametric econometric methods for panel data Abstract Doctoral dissertation considers gender wage differences and the propensity to hold multiple jobs as practices of the labour market that become especially visible during the first years of the transition to a market economy. These practices are characteristic of all the economic systems not only in transition economies. However, their scope and structure vary depending on the dynamics of adjustment of the factors influencing the functioning of the labour market. These practices may affect the social and economic policies of the transition countries and therefore monitoring them becomes important. Their analysis in this doctoral dissertation refers to the period of intensification of the privatization process of the early 2000s in Serbia and ends with a period when the first positive effects of structural reforms began to be perceived, which were then slowed down by the economic crisis of 2008. Two principal research hypotheses are examined: (i) are there statistically significant wage differences between men and women and can this difference be partly explained by an influence of discriminatory practice in wage determination; (ii) does the propensity to hold more than one job depend on primary job wages and hours of work, expected wages from a second job, as well as on other determinants that may affect individuals’ decisions to be engaged in more than one job simultaneously. Both hypotheses are empirically confirmed. The data are taken from the Living standards measurement survey, based on which a panel sample for 2002 and 2003, as well as a cross-section data set for 2007 were created. Since both the employment and participation rates of men and women differ substantially, the gender wage gap is examined taking into account the correction for sample selection bias of those who choose the employment in the wage sector. The gender wage gap is initially computed by using the maximum likelihood estimation of the sample selection model for cross-section data. According to this method, the gender wage gap has declined from 10.96 to 5.97 percent over the observed period. In a second step, the gender wage gap was estimated based on a semiparametric model of sample selection with nonparametric correction for potential bias due to non-random selection into the employment. The differences in the wage structure obtained by the parametric and semiparametric models of sample selection were tested and it is concluded that the parametric specification is the better fit for the wage function. The third method uses the within estimator of fixed effects model to estimate the wage functions. This method confirms the potential influence of statistical discrimination on the determination of women’s wages. The fourth method uses the quantile regression approach to decompose the gender wage gap along the wage distribution. This method yields a larger wage gap (17.44 percent) in the lower part and a smaller wage gap (9.12 percent) in the upper part of the wage distribution, indicating the existence of a sticky floor effect. The fifth method estimates the probit model with random effects and confirms the assumption that the decision to choose an additional job is strongly financially motivated, e.g. primary job wages reduce the probability of multiple job holding by 20.8 percent, while the second job reservation wage increases this probability by 0.6 percent. This doctoral dissertation contributes to the literature by providing a comprehensive analysis of the gender wage gap at both the mean and along the wage distributions of all employees in Serbia during the period of intensive structural reforms. In the analysis of these practices, parametric and semiparametric models are used together with the econometric methods of estimation of the cross-section and panel data. The dissertation examines the characteristics of those employees who have more than one job and the determinants that simultaneously affect the probability of multiple job holding. The main results of this analysis are obtained by using several comparative methodological approaches and they indicate the existence of a significant unexplained gender wage gap capturing wage discrimination and the significance of the factors affecting the probability of choosing more than one job, primarily in the informal sector. The findings suggest that the focus of the public policies should be directed towards those institutions that may strengthen the bargaining position of women and contribute to combating informal practices in the Serbian labour market. Key words: econometric methods, gender wage gap, micro panel, multiple job holding, probit model with random effects, sample selection model, semiparametric estimation, wage function. Scientific field: Social Sciences, Economics Specific scientific field: Labour Economics and Applied Econometrics JEL Classification: C33, C34, J22, J24, J31, J71 UDC: 331.5:519.862(043.3); 005.337:519.862(043.3) Analiza razlika u zaradama i višestrukog izbora zaposlenja vii SADRŽAJ Rezime ................................................................................................................................................... v Abstract ................................................................................................................................................ vi Pregled simbola ................................................................................................................................... ix Pregled skraćenica ............................................................................................................................... x Pregled tabela ...................................................................................................................................... xi Pregled slika ...................................................................................................................................... xii 1. UVOD........................................................................................................................................... 1 2. EKONOMETRIJSKI MODELI ZA MIKRO PODATKE PANELA I METODI OCENJIVANJA .......................................................................................................................... 9 2.1 Izabrani modeli zavisne promenljive sa ograničenjem u podacima panela ........................ 11 2.1.1 Modeli binarnog izbora ............................................................................................ 12 2.1.1.1 Prikaz osnovnih modela ........................................................................................... 12 2.1.1.2 Model binarnog izbora sa fiksnim efektima ............................................................. 15 2.1.1.3 Model binarnog izbora sa slučajnim efektima ......................................................... 17 2.1.2 Parametarski metodi ocenjivanja ............................................................................. 19 2.1.2.1 Osnove metoda maksimalne verodostojnosti ........................................................... 19 2.1.2.2 Metodi ocenjivanja modela binarnog izbora ........................................................... 21 2.1.3 Poluparametarski metodi ocenjivanja ...................................................................... 28 2.2 Modeli za odsečene i cenzurisane podatke panela .............................................................. 32 2.2.1 Model izbora podataka ............................................................................................. 33 2.2.2 Tobit modeli ............................................................................................................. 37 2.2.3 Parametarski metodi ocenjivanja modela izbora – uporedni podaci ........................ 40 2.2.4 Poluparametarski metodi ocenjivanja modela izbora i Tobit modela – uporedni podaci ...................................................................................................................... 44 2.2.4.1 Metodi ocenjivanja modela izbora podataka .......................................................... 44 2.2.4.2 Metodi ocenjivanja Tobit modela ............................................................................ 48 2.2.5 Metodi ocenjivanja modela izbora – podaci panela ................................................. 53 2.2.5.1 Metodi ocenjivanja modela izbora podataka sa fiksnim efektima ........................... 53 2.2.5.2 Metodi ocenjivanja modela izbora podataka sa slučajnim efektima ....................... 58 2.3 Kvantilne regresije u podacima panela ............................................................................... 62 2.3.1 Specifikacija modela ................................................................................................ 63 2.3.2 Metodi ocenjivanja ................................................................................................... 64 3. TESTOVI I POSLEDICE POGREŠNE SPECIFIKACIJE U MODELIMA PANELA .... 68 3.1 Testovi heteroskedastičnosti, autokorelacije i odsustva normalnosti ................................. 69 3.1.1 Heteroskedastičnost ................................................................................................. 69 3.1.2 Autokorelacija .......................................................................................................... 71 3.1.3 Odsustvo normalnosti .............................................................................................. 73 3.2 Hausman-ov test specifikacije ............................................................................................ 75 3.3 Pristrasnost usled neslučajnog izbora podataka u panelu ................................................... 77 4. EKONOMSKI MODELI FUNKCIJE ZARADA .................................................................. 83 4.1 Klasični modeli vrednovanja ljudskog kapitala .................................................................. 86 4.1.1 Ulaganje u ljudski kapital – teorijski pristup ........................................................... 86 4.1.2 Funkcija zarada zasnovana na vrednovanju ljudskog kapitala ................................. 89 4.1.3 Proširena funkcija zarada ......................................................................................... 95 4.2 Modeli izbora dodatnog zaposlenja .................................................................................... 96 4.2.1 Funkcija ponude dodatnog rada ............................................................................... 96 4.2.2 Dinamički model ponude dodatnog rada ............................................................... 103 5. STATISTIČKI METODI MERENJA RAZLIKA U ZARADAMA .................................. 107 Analiza razlika u zaradama i višestrukog izbora zaposlenja viii 5.1 Standardni metodi dekompozicije razlika u zaradama Blinder-a i Oaxaca-e ................... 111 5.1.1 Metodi dekompozicije razlika u zaradama ............................................................ 111 5.1.2 Metodi detaljne dekompozicije razlika u zaradama ............................................... 119 5.2 Proširenje standardnog obrasca dekompozicije razlika u zaradama nakon izbora metoda ocenjivanja ........................................................................................................................ 123 5.2.1 Metod dekompozicije u modelima sa korekcijom za neslučajan izbor podataka .. 123 5.2.2 Metod dekompozicije u modelima panela ............................................................. 126 5.2.3 Metod dekompozicije u kvantilnim regresijama .................................................... 132 6. DOSADAŠNJA ISKUSTVA U OCENI RODNIH RAZLIKA U ZARADAMA I VIŠESTRUKOG IZBORA ZAPOSLENJA ......................................................................... 138 6.1 Rezultati empirijskih studija za tranzicione zemlje i razvijene zemlje ............................. 139 6.1.1 Analiza razlika u zaradama u izabranim zemljama ................................................ 139 6.1.2 Analiza višestrukog izbora zaposlenja u izabranim zemljama ............................... 154 6.2 Raniji doprinosi empirijskih studija u analizi nacionalnih mikro podataka ...................... 156 6.2.1 Analiza razlika u zaradama u Srbiji ....................................................................... 156 6.2.2 Analiza višestrukog izbora zaposlenja u Srbiji ...................................................... 160 7. EMPIRIJSKA ANALIZA RAZLIKA U ZARADAMA I VIŠESTRUKOG IZBORA ZAPOSLENJA U SRBIJI EKONOMETRIJSKIM METODIMA PANELA ................... 161 7.1 Tržište rada u Srbiji .......................................................................................................... 161 7.2 Mikro podaci panela kao osnova za ekonometrijsko istraživanje ..................................... 165 7.3 Polazne istraživačke hipoteze ........................................................................................... 166 7.4 Merenje diskriminacije i rezultati ocenjivanja rodnih razlika u zaradama ....................... 169 7.4.1 Opis podataka .......................................................................................................... 169 7.4.1.1 Uporedni podaci ................................................................................................... 170 7.4.1.2 Podaci panela ....................................................................................................... 175 7.4.2 Analiza rodnih razlika u zaradama .......................................................................... 178 7.4.2.1 Ocenjivanje modela izbora podataka ................................................................... 181 7.4.2.2 Blinder-Oaxaca dekompozicija rodnih razlika u zaradama ................................. 191 7.4.2.3 Izbor između parametarske i poluparametarske specifikacije .............................. 198 7.4.3 Ispitivanje prisustva statističke diskriminacije ........................................................ 204 7.4.4 Razlike u zaradama duž raspodele zarada muškaraca i žena ................................... 213 7.4.4.1 Ocenjivanje kvantilnih regresija ........................................................................... 214 7.4.4.2 Machado-Mata dekompozicija rodnih razlika u zaradama .................................. 219 7.5 Ocenjivanje modela višestrukog izbora zaposlenja .......................................................... 224 7.5.1 Karakteristike lica koja imaju više od jednog zaposlenja ........................................ 224 7.5.2 Ocena funkcije zarada od dodatnog rada ................................................................. 227 7.5.3 Ocena modela ponude dodatnog rada ...................................................................... 232 8. ZAKLJUČAK ......................................................................................................................... 235 8.1 Teorijske i praktične implikacije ...................................................................................... 236 8.2 Doprinos rada i predlozi za buduća istraživanja ............................................................... 240 LITERATURA ................................................................................................................................ 242 PRILOZI ......................................................................................................................................... 256 Prilog 1: Prilog uz poglavlje 6 ......................................................................................................... 256 Prilog 2: Prilog uz poglavlje 7 ......................................................................................................... 259 Prilog 3: Biografija autora ............................................................................................................... 292 Prilog 4: Izjava o autorstvu .............................................................................................................. 293 Prilog 5: Izjava o istovetnosti štampane i elektronske verzije doktorskog rada ............................... 294 Prilog 6: Izjava o korišćenju ............................................................................................................. 295 Analiza razlika u zaradama i višestrukog izbora zaposlenja ix Pregled simbola Cov(.) Kovarijansa Corr(.) Korelacija E(.) Očekivana vrednost F(.) Funkcija raspodele F F-statistika testa f(.) Funkcija gustine (.) Standardizovana normalna raspodela (.) Funkcija gustine standardizovane normalne raspodele H(.) Hesijan (Hessian) matrica L(.) Logistička raspodela l(.) Funkcija verodostojnosti Ln Prirodni logaritam N(.) Normalna raspodela N Veličina uzorka ) 1 ( N OP Red u verovatnoći, gde je N veličina uzorka P Verovatnoća sgn(.) Funkcija znak T Vreme t t-statistika testa U[0,1] Uniformna raspodela Var(.) Varijansa  Element skupa  Kronekerov proizvod  Skup realnih brojeva   N i ip 1 Operator za umnožak   N i ip 1 Operator za sumiranje  Matrica varijanse i kovarijanse  Podskup  Proporcija  Ekvivalentno  Približno  Približno jednako  Definicija, promenljiva reprezentovana (sa) 2 (.) Test statistika 2 raspodele  Za svako  Teži D Teži u raspodeli P Teži u verovatnoći . Norma Δ Razlika Analiza razlika u zaradama i višestrukog izbora zaposlenja x Pregled skraćenica AIK Akaikov informacioni kriterijum AR(n) Autoregresioni model (proces) n-tog reda ARS Anketa o radnoj snazi AŽS Anketa o životnom standardu BFN Bhargava, Franzini i Narendranathan statistika testa BIK Bajesov informacioni kriterijum BL Baltagi i Li statistika testa BO Blinder-Oaxaca dekompozicija razlika u zaradama CLM Metod uslovne maksimalne verodostojnosti Const Konstanta EU Evropska unija EU- SILC European Union – Statistics on Income and Living Conditions FE-2SLS Dvostepeni metod najmanjih kvadrata sa fiksnim efektima GLS Metod uopštenih najmanjih kvadrata H Hausman-ova statistika testa IID Oznaka za raspodelu slučajne promenljive (nezavisne i identično raspoređene) ISCED International Standard Classification of Education IV Metod instrumentalnih promenljivih KS Kolmogorov-Smirnov test LAD Metod najmanjih apsolutnih odstupanja LM Test Lagrange-ovog multiplikatora LPM Linearni model verovatnoće LR Test količnika verodostojnosti LSDV Model panela sa veštačkim promenljivim MA(n) Proces pokretnih proseka n-tog reda ML Metod maksimalne verodostojnosti MM Metod momenata MSL Metod simulacije maksimalne verodostojnosti OLS Metod običnih najmanjih kvadrata Q Kvantil RS Republika Srbija SAD Sjedinjene Američke Države SCLS Metod simetrično cenzurisanih najmanjih kvadrata STLS Metod simetrično skraćenih najmanjih kvadrata WLS Metod ponderisanih najmanjih kvadrata Analiza razlika u zaradama i višestrukog izbora zaposlenja xi Pregled tabela Tabela 1: Deskriptivne statistike promenljivih, muškarci ........................................................................ 171 Tabela 2: Deskriptivne statistike promenljivih, žene ............................................................................... 173 Tabela 3: Deskriptivne statistike promenljivih, podaci panela ................................................................ 176 Tabela 4: Jednačina zarada ocenjena metodom OLS na združenom uzorku, 2002-2007. god. ............... 179 Tabela 5: Kolmogorov-Smirnov test jednakosti raspodela zarada muškaraca i žena............................... 181 Tabela 6: ML i OLS ocene modela izbora podataka za žene – jednačina zarada, 2002 ........................... 183 Tabela 7: ML i OLS ocene modela izbora podataka za muškarce – jednačina zarada, 2002 ................... 185 Tabela 8: ML i OLS ocene modela izbora podataka za žene – jednačina zarada, 2003 ........................... 186 Tabela 9: ML i OLS ocene modela izbora podataka za muškarce – jednačina zarada, 2003 ................... 187 Tabela 10: ML i OLS ocene modela izbora podataka za žene – jednačina zarada, 2007 ......................... 188 Tabela 11: ML i OLS ocene modela izbora podataka za muškarce – jednačina zarada, 2007 ................. 190 Tabela 12: Rodne razlike u zaradama ...................................................................................................... 191 Tabela 13: Detaljna dvočlana Blinder-Oaxaca dekompozicija rodnih razlika u zaradama ...................... 193 Tabela 14: Detaljna tročlana Blinder-Oaxaca dekompozicija rodnih razlika u zaradama ....................... 196 Tabela 15: Hausman-ov test – parametarska vs. poluparametarska specifikacija .................................... 201 Tabela 16: Uporedni prikaz razlaganja ukupnog jaza u zaradama po parametarskom ML i poluparametarskom dvostemenom metodu ............................................................................. 202 Tabela 17: Testiranje razlika u zaradama, radnom iskustvu i starosti prema nivou obrazovanja zaposlenih muškaraca i žena...................................................................................................................... 206 Tabela 18: Ocenjene jednačine zarada – zaposlene žene ......................................................................... 208 Tabela 19: Testiranje hipoteze o statističkoj diskriminaciji ..................................................................... 210 Tabela 20: Provera robustnosti hipoteze o statističkoj diskriminaciji ...................................................... 211 Tabela 21: Machado-Mata dekompozicija rodnih razlika po kvantilima raspodele zarada ..................... 221 Tabela 22: Ispitivanje prisustva efekata klizavog poda i staklenog plafona na bazi ocena kvantilnih regresija zarada ........................................................................................................................ 223 Tabela 23: Distribucija zaposlenih prema radnom mestu na osnovnom i dodatnom poslu, u % ............. 226 Tabela 24: Distribucija zaposlenih prema ekonomskom sektoru na osnovnom i dodatnom poslu, u % .. 226 Tabela 25: Distribucija zaposlenih prema sektoru vlasništva na osnovnom i dodatnom poslu, u % ....... 227 Tabela 26: Ocene jednačine zarada od dodatnog posla ............................................................................ 230 Tabela 27: Ocene i marginalni efekti probit modela sa slučajnim efektima - model izbora dodatnog posla ...................................................................................................................................... 233 Tabela P6.1: Uporedni pregled literature o rodnim razlikama u zaradama za Srbiju i izabrane zemlje .. 256 Tabela P6.2: Uporedni pregled literature o izboru dodatnog zaposlenja za Srbiju i izabrane zemlje ...... 258 Tabela P7.1: Izbor uzorka ........................................................................................................................ 259 Tabela P7.2: Opis promenljivih: modeli zarada i jednačina izbora ......................................................... 260 Tabela P7.3: ML ocene modela izbora podataka za žene – jednačina izbora, 2002 ................................ 262 Tabela P7.4: ML ocene modela izbora podataka za žene – jednačina izbora, 2003 ................................ 263 Tabela P7.5: ML ocene modela izbora podataka za žene – jednačina izbora, 2007 ................................ 264 Tabela P7.6: Detaljna tročlana Blinder-Oaxaca dekompozicija razlika u zaradama sa pojedinačnim doprinosima promenljivih .................................................................................................. 265 Tabela P7.7: Ocene poluparametarskog jednoindeksnog modela binarnog izbora .................................. 267 Tabela P7.8: Ocene parametarskog probit modela binarnog izbora ........................................................ 269 Tabela P7.9: Ocene jednačine zarada poluparametarskim dvostepenim metodom ................................. 271 Tabela P7.10: Marginalni efekti probit modela i modela korigovanog za prisustvo heteroskedastičnosti – žene .................................................................................................................................... 273 Tabela P7.11: Marginalni efekti probit modela i modela korigovanog za prisustvo heteroskedastičnosti – svi ....................................................................................................................................... 275 Tabela P7.12: Ocenjene jednačine zarada – zaposleni muškarci ............................................................. 277 Tabela P7.13: Ocenjene jednačine zarada – svi zaposleni muškarci i žene ............................................. 278 Tabela P7.14: Ocenjene jednačine zarada muškaraca 2002-2003. god., OLS i kvantilne regresije ........ 279 Tabela P7.15: Ocenjene jednačine zarada muškaraca 2002-2003. god., FE i kvantilne regresije sa FE . 281 Tabela P7.16: Ocenjene jednačine zarada žena 2002-2003. god., OLS i kvantilne regresije .................. 282 Tabela P7.17: Ocenjene jednačine zarada žena 2002-2003. god., FE i kvantilne regresije sa FE ........... 284 Tabela P7.18: Ocenjene jednačine zarada muškaraca po godinama 2002., 2003. god., OLS i kvantilne regresije .............................................................................................................................. 285 Analiza razlika u zaradama i višestrukog izbora zaposlenja xii Tabela P7.19: Ocenjene jednačine zarada žena po godinama 2002., 2003. god., OLS i kvantilne regresije .............................................................................................................................. 287 Tabela P7.20: Karakteristike lica koja imaju više od jednog zaposlenja, panel podaci ........................... 289 Tabela P7.21: Ocene i marginalni efekti probit modela sa slučajnim efektima ....................................... 291 Pregled slika Slika 1: Ocena funkcije gustine zarada muškaraca i žena metodom jezgra ............................................. 181 Slika 2: Doprinosi razlikama u karakteristikama objašnjenom delu jaza ................................................. 203 Slika 3: Doprinosi razlikama u prinosima na karakteristike neobjašnjenom delu jaza ............................ 203 Slika 4: Ocene kvantilne regresije sa fiksnim efektima zarada muškaraca .............................................. 216 Slika 5: Ocene kvantilne regresije sa fiksnim efektima zarada žena ........................................................ 218 Slika 6: Machado-Mata dekompozicija rodnih razlika u zaradama, 2002-2003. god. ............................. 219 Slika 7: Machado-Mata dekompozicija rodnih razlika u zaradama, po godinama ................................... 220 Analiza razlika u zaradama i višestrukog izbora zaposlenja 1 1. UVOD Pitanje obima i strukture rodnih razlika u zaradama (en. gender wage gap) počelo je da zaokuplja pažnju ekonomista kako se povećavalo učešće žena u ukupnoj radnoj snazi (Mincer 1962a; Mroz 1987). Prve empirijske studije o rodnim razlikama u zaradama koriste teorijski model zarada kojim se zarade prevashodno određuju kao rezultat uticaja koji na njihovo kretanje tokom životnog ciklusa imaju faktori ljudskog kapitala obrazovanje i radno iskustvo (Mincer 1958, 1974). Ovim modelom objašnjeno je kretanje dela ukupne razlike u zaradama muškaraca i žena koja se formira pod uticajem posmatranih karakteristika. Međutim, jedan deo ukupne razlike ne može da se objasni doprinosom posmatranih karakteristika i rezultat je mogućeg uticaja diskriminacije u određivanju zarada žena (Becker 1982). Becker-ova teorija o ekonomskoj diskriminaciji, koja je nastala 1957. godine, polazi od pretpostavke da preferencije diskriminacije nastaju kao rezultat želje pojedinca da zadrži distancu u odnosu na diskriminisanu grupu na tržištu rada. Prema primarnom konceptu (Blinder 1973; Oaxaca 1973), rodne razlike u zaradama se sagledavaju kroz uticaj koji nastaje usled razlika u posmatranim karakteristikama, kao i kroz uticaj koji je rezultat različitih struktura zarada i uključuje potencijalne efekte diskriminacije. Ovaj koncept merenja rodnih razlika u zaradama je poslužio brojnim autorima za razvijanje modifikovanih metoda dekompozicije rodnog jaza (Oaxaca i Ransom 1999; Neuman i Oaxaca 2004; Machado i Mata 2005; Melly 2005a; Albrecht et al. 2009 i dr.). U post-socijalističkim zemljama centralne i istočne Evrope i bivšeg Sovjetskog Saveza, pitanje rodnih razlika u zaradama postaje još značajnije, jer se polazi od pretpostavke da prelaz na tržišne uslove privređivanja utiče na lošiji položaj žena na tržištu rada i samim tim na produbljivanje rodnih razlika u zaradama. Međutim, rezultati empirijskih studija ne dovode do jedinstvenog zaključka i razlikuju se po zemljama. U većini tranzicionih zemalja, ekonomski položaj žena je bio lošiji u prvim godinama tranzicije nego u prethodnom sistemu (Brainerd 2000; Newell i Reilly 2001). Potom, u jednom broju tranzicionih zemalja dolazi do poboljšanja relativnog položaja žena, i to ne samo zato što tržište destimuliše diskriminatorno ponašanje, već i zbog strukturnih promena koje su usledile sa privatizacijom i otvaranjem ekonomija (Orazem i Vodopivec 1995; Analiza razlika u zaradama i višestrukog izbora zaposlenja 2 Paternostro i Sahn 1999; Grajek 2003; Jolliffe i Campos 2005). Iako je prisutan opšti trend konvergencije zarada zahvaljujući unapređenim posmatranim karakteristikama žena, rodne razlike u zaradama ostaju i dalje duboko ukorenjene u nekim tranzicionim ekonomijama (Brainerd 2000). U brojnim studijama koje su posvećene ovom problemu, izlažu se rezultati koji pokazuju da se kretanje rodnih razlika u zaradama objašnjava većom zastupljenošću žena u određenim ekonomskim i vlasničkim sektorima (Adamchik i Bedi 2003; Jurajda 2003), njihovom segregacijom po zanimanjima (Ogloblin 1999; Jurajda i Harmgart 2007), ili pak izlaskom žena sa niskim kvalifikacijama sa tržišta rada (Hunt 2000). U većini tranzicionih zemalja struktura rodnog jaza u zaradama postaje slična onoj koja postoji u razvijenim tržišnim ekonomijama, dok njegov obim varira kroz zemlje (Blau i Kahn 2006; Christofides et al. 2013 i dr.). Posvećenost pitanju rodnih nejednakosti u oblasti zapošljavanja i socijalne politike je jedan od prioriteta koji se nameće zemljama koje teže ka punopravnom članstvu u EU. Od svih zemalja, uključujući i Srbiju, očekuje se usaglašenost sa acquis communautaire i potpuna primena propisa kojima se zabranjuje diskriminacija i sprečava produbljivanje rodnih nejednakosti na tržištu rada. Obim i struktura rodnih razlika u zaradama posmatra se u svetlu plaćenog rada na osnovnom poslu, a analiza ove prakse je važna u savremenom organizacionom okruženju zato što može imati šire ekonomske i socijalne posledice na formiranje ukupne ponude rada. Tokom karijere, vodeći se različitim motivima, zaposleni mogu da pored osnovnog biraju i jedan ili više dodatnih poslova utičući na formiranje strukture i obima ponude dodatnog rada (Shishko i Rostker 1976; Paxson i Sicherman 1996). Praksa višestrukog izbora zaposlenja (en. multiple job holding) je prisutna u svim ekonomskim sistemima. U tranzicionim post-socijalističkim ekonomijama, međutim, naglašenost ove prakse najčešće ukazuje na postojanje paralelnih tržišta rada, odraz je duboke segmentiranosti i skromne ponude poslova u formalnom sektoru, odnosno slabosti u funkcionisanju tržišta rada (Foley 1997; Bedi 1998). Iz izloženog sledi da je praćenje ovih pojava važno kako za donosioce javnih politika tako i za širu istraživačku zajednicu i druge učesnike na tržištu rada. Analiza razlika u zaradama i višestrukog izbora zaposlenja 3 Obe analizirane prakse mogu da se posmatraju kao deo globalnih pojava, koje dele zajedničke karakteristike, bilo da se javljaju u tranzicionim zemljama, u zemljama u razvoju ili u razvijenim zemljama, s tim što njihov obim i struktura variraju kroz vreme i zemlje. Njihova analiza na tržištu rada Srbije, smeštena je u vremenski kontekst koji se, s jedne strane, odnosi na intenziviranje procesa privatizacije i njenog značajnijeg uticaja na tržište rada s početka 2000-tih, a s druge strane, na period kada su počeli da se uočavaju prvi pozitivni efekti strukturnih reformi na funkcionisanje tržišta rada koji su potom zaustavljeni i usporeni ekonomskom krizom iz 2008. godine. Teorijski osnov za analizu ovih praksi je dosta širok i ima ishodište u mnogim naučnim disciplinama, ali će fokus u doktorskoj disertaciji biti samo na ekonomskom pristupu. Prve studije o rodnim razlikama u zaradama u nas posmatraju dinamiku jaza tokom 1990-ih godina i odnose se na SR Jugoslaviju (Krstić i Reilly 2000), dok je prva opsežna studija rodnih razlika u zaradama za Srbiju urađena za period od 2008. do 2011. godine (FREN 2013). Jedina studija koja se bavi analizom višestrukog izbora zaposlenja u SR Jugoslaviji urađena je na podacima iz 1998. godine (Reilly i Krstić 2003). Predmet istraživanja u doktorskoj disertaciji je dakle najmanje dvojak. Jedan deo istraživanja je posvećen analizi rodnih razlika u zaradama u Srbiji, osvrtu na prethodne rezultate drugih autora dobijene na podacima za Srbiju, kao i poređenju sa rezultatima metodološki bliskih studija za druge zemlje. Drugi deo istraživanja se odnosi na analizu faktora koji doprinose tome da se zaposleni, pored osnovnog, opredeljuju za jedan ili više dodatnih poslova, najčešće, da bi izašli u susret osnovnim potrebama iz kojih nastaju očekivani obrasci potrošnje. Stoga je primarni cilj istraživanja u doktorskoj disertaciji da se pokaže koliki je bio i da li se menjao rodni jaz u zaradama tokom perioda kada su sprovođene značajne ekonomske reforme koje su imale svoj odraz na menjanje institucionalnog okruženja, pa samim tim i na promene tržišta rada, kao i na menjanje strukture vlasništva realnog sektora u Srbiji. S tim u vezi, posebna pažnja je posvećena interpretaciji uticaja produktivnih karakteristika na rodne razlike u zaradama, ali i sagledavanju značaja neopaženih karakteristika koje kriju uticaj diskriminacione prakse u određivanju zarada. Drugi cilj proizlazi iz značaja koji izbor dodatnog zaposlenja može da ima na ukupnu ponuda rada, imajući u vidu saznanje da je za većinu zanimanja dodatni posao najčešće izmešten iz formalnog u neformalni sektor. U tom Analiza razlika u zaradama i višestrukog izbora zaposlenja 4 svetlu, zadatak je da se utvrdi u kojoj meri očekivana zarada na dodatnom poslu, odnosno ostvarena zarada na osnovnom poslu, utiču na izbor dodatnog zaposlenja, kao i da se identifikuju druge determinante i ocene efekti njihovog uticaja na odluke koje zaposleni donose kada se opredeljuju za dodatni posao. U analizi se polazi od sledećih istraživačkih hipoteza:  Postojanje diskriminacije u određivanju zarada muškaraca i žena na tržištu rada Srbije tokom perioda strukturnih reformi. Činioci koji su se nepovoljno odrazili na strukturu radne snage uzrokovani su promenama ekonomske strukture (potražnje za radom) usled gašenja preduzeća ili nestanka ekonomskih aktivnosti. Ove promene se ogledaju u snažnom padu radne aktivnosti muškaraca i žena (ponude rada). Međutim, pad učešća žena u radnoj snazi je bio oštriji, što je dobrim delom rezultat izlaska iz radne snage nisko kvalifikovanih žena. Pitanje od interesa za istraživanje jeste kako u uslovima nastajanja novih ekonomskih i društvenih struktura tržište i menadžeri u organizacijama nagrađuju karakteristike zaposlenih. Kao rezultat testiranja ove hipoteze očekuje se da postoji uticaj diskriminacije, i to kako u određivanju ukupnih zarada tako i u određivanju zarada žena sa kraćim radnim iskustvom u organizaciji, kao i da se rodni jaz širi duž raspodele zarada od najnižih ka najvišim. Saznanje o obimu i strukturi rodnog jaza u zaradama i uticaju diskriminacije nije važno samo zbog toga što može da se negativno odrazi na ekonomsko blagostanje zaposlenih žena i karijerno napredovanje, već i zbog toga što može da utiče na njihovu dalju odluku da se uključe u radnu snagu i da ima šire implikacije na socijalnu politiku. U okviru navedene hipoteze biće testirani i efekti eventualnih (makroekonomskih) šokova i neravnoteža kroz vreme, odnosno značajnost promena u dinamici rodnog jaza u zaradama tokom vremena.  Ponuđena stopa zarada na drugom poslu utiče pozitivno, a stopa zarada na osnovnom poslu utiče negativno na verovatnoću izbora dodatnog zaposlenja. Sklonost ka izboru više od jednog posla, pre svega, u neformalnom sektoru, u tranzicionim post- socijalističkim ekonomijama se objašnjava strategijom preživljavanja u uslovima niskih i neredovnih zarada, nedovoljne zaposlenosti na osnovom poslu i izvesnosti gašenja tog posla. S druge strane, stopa dodatnog zaposlenja, samo je jedan u nizu pokazatelja obima neformalnog sektora, ukazuje na to sa kakvim ograničenjima se susreće privatni sektor u pogledu prilagođavanja stvarne ponuđenoj strukturi zanimanja, fleksibilnosti Analiza razlika u zaradama i višestrukog izbora zaposlenja 5 radnog vremena kroz izbor časova rada i slično. Očekuje se da se testirana hipoteza potvrdi, ali da se identifikuju i ostali faktori, kao i da se utvrdi smer i jačina njihovog uticaja na verovatnoću izbora dodatnog zaposlenja.  Postojanje prekomerne identifikovanosti, odsustvo normalnosti i heteroskedastičnost slučajne greške u modelima izbora podataka. Problem identifikovanosti u modelu izbora podataka ogleda se u tome što nije moguće dobiti jedinstvene ocene regresionih parametara ukoliko nije zadovoljen uslov identifikacije. Stoga, specifikacija koja se sastoji od osnovne jednačine (model zarada) i jednačine izbora podataka (redukovana forma modela) zahteva testiranje hipoteze o prekomernoj identifikovanosti, što je učinjeno standardnim testom isključenosti promenljivih koje utiču na verovatnoću izbora iz osnovne jednačine. Potreban ali ne i dovoljan uslov identifikacije jeste da se u osnovnu jednačinu uključi nelinearni član u formi inverznog Mills-ovog količnika iz jednačine izbora. Modeliranje i priroda mikro podataka panela često uzrokuju i niz ekonometrijskih problema, kao što su heteroskedastičnost ili odsustvo normalnosti slučajne greške. Zato su ti problemi testirani u ocenjenim modelima primenom standardnih testova. Narušenost pretpostavke o normalnosti slučajne greške kod primene parametarskih metoda ima za rezultat nekonzistentne ocene regresionih parametara, te se predlaže primena poluparametarskih metoda. Struktura doktorske disertacije po poglavljima je sledeća. Nakon uvodnog dela, u kojem su definisani predmet i ciljevi istraživanja, kao i polazne istraživačke hipoteze, naredna dva poglavlja se odnose na ekonometrijsku metodologiju. U drugom poglavlju je dat pregled izabranih modela zavisne promenljive sa ograničenjem za uporedne podatke i za podatke panela. Posebno se prikazuju metodi ocenjivanja za parametarske i poluparametarske modele, a potom sledi pregled modela i metoda za odsečene i cenzurisane podatke. Ovaj deo poglavlja se izdvaja i po prikazu metoda ocenjivanja iz novije literature, a posebna pažnja je posvećena parametarskim i poluparametarskim metodima za modele izbora podataka, Tobit modele, kao i modele panela sa fiksnim i slučajnim efektima. Na kraju poglavlja su dati specifikacija i metodi ocenjivanja kvantilnih regresija, kao i novija metodološka rešenja koja omogućuju primenu kvantilnih regresija u modeliranju mikro podataka panela. Značaj ovog poglavlja je u tome što daje detaljan pregled modela i metoda ocenjivanja, najpre u analizi uporednih Analiza razlika u zaradama i višestrukog izbora zaposlenja 6 podataka, a zatim i u analizi podataka panela. U trećem poglavlju se razmatraju testovi heteroskedastičnosti, autokorelacije i odsustva normalnosti u podacima panela, kao i Hausman-ov (1978) test izbora specifikacije modela panela, koji se primenjuje i za poređenje parametarske i poluparametarske strukture modela. Posebna pažnja u ovom poglavlju je posvećena neslučajnom izboru, kao i odgovarajućim testovima za ispitivanje pristrasnosti usled neslučajnog izbora jedinica posmatranja u modelima panela koje su razvili Wooldridge (1995) i Semykina i Wooldridge (2010). Predmet razmatranja u četvrtom poglavlju su klasični modeli vrednovanja ljudskog kapitala koji su osnov za razumevanje rodnih razlika u zaradama i uopšte modeliranje funkcija zarada. Polazi se od klasičnog Mincer-ovog modela zarada (Mincer 1974) baziranog na ulaganju u ljudski kapital, koji se potom proširuje uvođenjem u analizu i drugih objašnjavajućih promenljivih. Drugi deo ovog poglavlja je posvećen modelima ponude dodatnog rada (Shishko i Rostker 1976; Paxson i Sicherman 1996). Polazi se od standardnog neoklasičnog pristupa koji izbor pojedinca da se uključi u sekundarno tržište rada bazira na ograničenju postavljenom na časove rada na osnovnom poslu. Prikazani su statički i dinamički modeli ponude dodatnog rada. U petom poglavlju su prikazani statistički metodi dekompozicije rodnog jaza Blinder-a (1973) i Oaxaca-e (1973). Predstavljeni su metodi razlaganja ukupnog jaza, kao i metod detaljne dekompozicije kojom se meri uticaj pojedinačnih promenljivih na stvarni jaz (Oaxaca i Ransom 1999). Data je interpretacija za svaku od komponenti rodnog jaza i ukazano na deo koji se odnosi na uticaj diskriminacije. Zatim je standardni obrazac dekompozicije modifikovan za primenu u modelima zarada koji uzimaju u obzir korekciju za neslučajan izbor i prirodu podataka panela, kao i u kvantilnim regresijama. Preostala dva poglavlja su posvećena empirijskoj analizi. Šesto poglavlje sadrži doprinose dosadašnje empirijske literature posvećene analizi rodnih razlika u zaradama i višestrukog izbora zaposlenja. Prikazani su rezultati analiza domaćih mikro podataka, kao i izabranih empirijskih studija za tranzicione post-socijalističke zemlje i razvijene zemlje, radi poređenja sa rezultatima koji su dobijeni u doktorskoj disertaciji. U sedmom poglavlju je predstavljena empirijska analiza rodnih razlika u zaradama i višestrukog izbora zaposlenja u Srbiji koja je dobijena primenom izloženih ekonometrijskih metoda. Analiza razlika u zaradama i višestrukog izbora zaposlenja 7 Sistematizovani su rezultati ocenjivanja rodnih razlika u zaradama i analize uticaja posmatranih faktora na izbor dodatnog zaposlenja. Doktorska disertacija se završava osnovnim zaključcima i predlozima mogućih pravaca narednih empirijskih istraživanja. Na posletku je dat pregled korišćene literature sa aneksom koji sadrži tabele. Doprinos doktorske disertacije ogleda se u tome što se u njoj prvi put celovito analiziraju rodne razlike u zaradama u srednjoj vrednosti i na različitim kvantilima raspodele zarada svih zaposlenih u Srbiji tokom perioda intenzivnih strukturnih reformi. U analizi ovih praksi korišćeni su parametarski i poluparametarski modeli i ekonometrijske tehnike ocenjivanja za uporedne podatke i podatke panela. U disertaciji se takođe razmatraju karakteristike zaposlenih koji pored osnovnog imaju i dodatno zaposlenje, i ocenjuju determinante koje utiču na verovatnoću simultanog izbora više od jednog zaposlenja. Informacionu osnovu za empirijsku analizu čine podaci ‘Ankete o životnom standardu’ (AŽS) na bazi koje je formiran uzorak panel podataka za 2002- 2003. godinu, kao i serija uporednih podataka za 2007. godinu. Zaključci i rezultati empirijske analize izložene u doktorskoj disertaciji su sledeći:  Na bazi ispitivanja prisustva rodnog jaza u srednjoj vrednosti zarada zaposlenih zaključeno je da je ukupan rodni jaz u zaradama po času, izraženim u logaritmima, bio najviši u 2002. godini, kada je iznosio 10,96%, kao i da se postepeno smanjivao i u 2007. godini opao na 5,97%. Pad ukupnog rodnog jaza rezultat je smanjenja komponente neobjašnjenog dela jaza, dok je doprinos razlike u posmatranim karakteristikama zaposlenih bio stabilan u posmatranom periodu.  Rezultati testiranja hipoteze o jednakosti ocena dvaju modela izbora podataka, parametarskog koji podrazumeva da je ispunjena pretpostavka o normalnosti i poluparametarskog koji ne polazi od pretpostavke o normalnosti, potvrdili su, u svim slučajevima, da je izbor parametarske specifikacije modela zarada opravdan. U poređenju sa parametarskom, poluparametarska specifikacija modela zarada potcenjuje ukupan rodni jaz.  Testirana je hipoteza o statističkoj diskriminaciji u determinisanju zarada žena i zaključeno je da, kada se posmatraju sve zaposlene žene, može da se zaključi da se zarade formiraju pod uticajem diskriminacije, ali taj zaključak ne može da se potvrdi i Analiza razlika u zaradama i višestrukog izbora zaposlenja 8 kada se posmatraju samo žene nižeg nivoa obrazovanja na uzorku panel podataka. Međutim, kada se uticaj radnog iskustva u istoj organizaciji posmatra u interakciji sa veštačkom promenljivom koja je indikator da pojedinac nema formalno obrazovanje, ocena je pozitivna i statistički značajna, što je potvrda testirane hipoteze o statističkoj diskriminaciji.  Ispitivana je značajnost efekta klizavog poda među primaocima najnižih zarada i staklenog plafona na drugom ekstremu raspodele zarada i zaključeno je da je prisustvo samo prvog efekta statistički značajno. Ocenjeni efekti klizavog poda i staklenog plafona iznose 17,44% i 9,12%, respektivno. Rezultati ove analize ukazuju na zaključak da su rodne razlike u zaradama najizraženije među primaocima najnižih zarada. Takođe, uočava se i blago kolebanje jaza na desnom kraku raspodele, tako da počinju da se naziru i efekti staklenog plafona koji sputavaju kretanje zarada žena na viši nivo i time doprinose širenju jaza.  Ispitivan je uticaj ekonomski određenih faktora na sklonost pojedinca da se opredeli za dodatni posao. Ocenjeni efekat ponuđene zarade na verovatnoću izbora drugog posla je očekivano pozitivan, ali nije statistički značajan, dok su efekti stvarne zarade i časova rada na osnovnom poslu negativni i imaju statistički značajan uticaj. Očekivana zarada na dodatnom poslu povećava verovatnoću izbora drugog posla za 0,6%, a stvarna zarada i časovi rada na osnovnom poslu je smanjuju redom za 20,8% i 27,0%. Na bazi sprovedene analize se zaključuje da je izbor dodatnog, pored osnovnog posla, motivisan ekonomskim faktorima. Analiza razlika u zaradama i višestrukog izbora zaposlenja 9 2. EKONOMETRIJSKI MODELI ZA MIKRO PODATKE PANELA I METODI OCENJIVANJA U ovom poglavlju doktorske disertacije se razmatraju ekonometrijski modeli mikro podataka panela i metodi njihovog ocenjivanja (modeli zavisne promenljive sa ograničenjem u podacima, modeli zavisne promenljive kada su podaci odsečeni i cenzurisani, kao i kvantilne regresije). Osnovne postavke ekonometrijskih modela mikro podataka, koji se razmatraju u doktorskoj disertaciji, zasnivaju se na primeni standardnih funkcija korisnosti koje služe za teorijsko uobličavanje mikroekonomskih problema. Iako su ovi modeli našli svoju inicijalnu primenu u biheviorističkim studijama vezanim za naučne oblasti medicine i psihologije, kasnije su se, uporedo sa razvojem statističkih programa, sve češće primenjivali i u užim oblastima društvenih nauka (na primer, u sociologiji, u političkim naukama i sl. (Aldrich i Nelson 1984)). U ekonomiji, a naročito u analizi fenomena vezanih za tržište rada i ponašanje potrošača i kompanija, popularnosti primene ovih metoda su doprineli Quandt i McFadden još sredinom prošlog veka (Quant 1954; McFadden 1974). Ovi metodi se primenjuju u cilju optimizacije funkcije korisnosti pojedinca ili maksimizacije profita kompanije koje su rezultat izbora najbolje alternative. Osamdesetih i devedesetih godina prošlog veka, uporedo sa povećanom dostupnošću mikro podataka prikupljanih na osnovu anketa, usledila je sve učestalija primena u empirijskim studijama modela binarnog izbora, modela za odsečene i cenzurisane podatke, kao i modela panela sa fiksnim i slučajnim efektima (Maddala 1987; Ichimura 1993; Powell 1994; Moffitt 1999 i dr.). To je dovelo i do prilagođavanja poluparametarskih i neparametarskih metoda ocenjivanja navedenim modelima, koji su fleksibilniji u pogledu definisanja funkcionalne forme u odnosu na parametarske metode. U literaturi posvećenoj teorijskoj ekonometriji poluparametarski pristup (en. semiparametric approach) se dovodi u vezu sa poluparametarskim modelima u kojima se zavisnost y od skupa nezavisnih promenljivih x može izraziti funkcijom )(.),,,( xfy  (videti npr. Powell 1994, 2008). Ova specifikacija uključuje vektor Analiza razlika u zaradama i višestrukog izbora zaposlenja 10 strukturnih parametara  konačnih dimenzija ( K , ), tj. parametarski deo modela, kao i neku neparametarsku komponentu (.) i grešku modela  koja nema raspodelu sa poznatim parametrima. Ova dva člana zajedno predstavljaju neparametarski deo modela. Pojam poluparametarski metodi ocenjivanja može biti pogrešno interpretiran, budući da isti metodi ocenjivanja mogu da se smatraju parametarskim, poluparametarskim ili neparametarskim, u zavisnosti od toga kakva ograničenja su data na ekonomsku specifikaciju modela (Powell 2008). Na primer, metod običnih najmanjih kvadrata može da se posmatra i kao poluparametarski metod ocenjivanja, ako je specifikacija modela ograničena samo uslovom o nezavisnosti regresora od greške modela, dok dalje pretpostavke o teorijskoj raspodeli greške modela nisu poznate. Dakle, poluparametarski metodi ocenjivanja se koriste za one ekonometrijske modele koji imaju mešovitu specifikaciju, u smislu da parametarski deo ove specifikacije predstavlja linearnu funkciju skupa posmatranih promenljivih, a ostatak čine neka nelinearna funkcija i greška modela na koje nisu eksplicitno postavljena ograničenja (Powell 2008). Ukoliko se u ocenjivanju parametarskog modela primenjuju parametarski metodi ocenjivanja, polazi se od pretpostavke da je na raspodelu slučajne greške postavljeno ograničenje kojim se ta raspodela svodi na familiju raspodela konačnih dimenzija sa poznatim parametrima. U tom slučaju, ocene parametara teže stvarnim vrednostima po stopi 2/1N i reda su u verovatnoći )/1( 2/1NOP . Neka je  stvarna vrednost ocenjenog parametra ˆ koja u slučaju primene parametarskog modela leži u konačnom prostoru  , takvom da je K , tada u uslovima u kojima važe pretpostavke asimptotske teorije ili teorije velikih uzoraka, stopa konvergencije iznosi 2/1N . Ekonometrijski metodi koji se primenjuju u ocenjivanju parametarskih modela daju konzistentne ocene nepoznatih parametara, a raspodela ocena teži asimptotski normalnoj raspodeli sa poznatim parametrima, sredinom 0 i matricom varijansi i kovarijansi  ')],()[,( xyfxyfE , odnosno ),0()ˆ(  NN D . S druge strane, suština primene ekonometrijskih metoda u ocenjivanju poluparametarskih modela jeste da se, i u uslovima kada jedan deo parametara modela ne leži u konačnom prostoru, odnosno Analiza razlika u zaradama i višestrukog izbora zaposlenja 11 kada raspodela greške modela nije poznata,1 pronađe konzistentan metod ocenjivanja parametara modela u uslovima čije primene će i dalje važiti najmanje stopa konvergencije koja važi i u parametarskim modelima. Za ocene koje su dobijene ocenjivanjem poluparametarskih modela važi da su N konzistentne, pri čemu je 2/1N maksimalna stopa konvergencije. 2 2.1 Izabrani modeli zavisne promenljive sa ograničenjem u podacima panela U modelima zavisne promenljive sa ograničenjem (en. limited dependent variable), razlikujemo nekoliko načina kojima se postavljaju ograničenja u podacima zavisne promenljive (Griffiths et al. 1993; Hsiao 2003). Ograničenje na opservacije zavisne promenljive može biti postavljeno utvrđivanjem konačnog broja vrednosti, kada ovu promenljivu nazivamo diskretnom. Ukoliko su opservacije zavisne promenljive koja je po svojoj prirodi kontinuelna odnosno neprekidna, ograničene uslovom da ne mogu uzeti negativne vrednosti ili vrednosti veće od neke određene konstante, reč je o cenzurisanim podacima zavisne promenljive (en. censored variable), ili je pak reč o podacima zavisne promenljive koji su odsečeni u tački koja predstavlja ograničenje u funkciji raspodele slučajne promenljive (en. truncated variable). Drugim rečima, ako diskretna zavisna promenljiva uzima vrednost 1 ili 0 (binarna promenljiva), opservacije takve zavisne promenljive modeliraju se ekonometrijskim modelima binarnog izbora (en. binary choice models). Ukoliko su opservacije zavisne promenljive koje se nalaze izvan određenog intervala u potpunosti odstranjene, u modeliranju podataka te zavisne promenljive se koriste modeli za odsečene podatke. Nadalje, ako su opservacije zavisne promenljive koje leže izvan određenog intervala zamenjene nekom konstantnom vrednošću, koja u slučaju klase Tobit modela može biti 0, podaci takve zavisne promenljive se modeliraju ekonometrijskim modelima za cenzurisane podatke. Ovi modeli su poznati pod nazivom modeli za odsečene i cenzurisane podatke (en. truncated and censored regression models). U zavisnosti od tipa ograničenja u 1 Za grešku modela tada važi širi skup pretpostavki kao što su, na primer, nezavisnost greške modela od regresora, simetrična raspodeljenost grešaka modela oko nule za dati skup regresora, sa ciljem da bi se identifikovali regresioni parametri  (Powell 2008). Ovi problemi su svojstveni ocenjivanju modela zavisne promenljive sa ograničenjem u podacima, kao što će se videti u nastavku ovog poglavlja. 2 Detaljnije o osobinama poluparametarskih modela videti u Powell (1994). Analiza razlika u zaradama i višestrukog izbora zaposlenja 12 opservacijama zavisne promenljive koriste se različiti modeli zavisne promenljive sa ograničenjem i shodno tome se biraju adekvatni metodi ocenjivanja tih modela (videti npr. Hsiao 2003). U teorijskoj ekonometrijskoj literaturi broj modela iz klase modela zavisne promenljive sa ograničenjem je daleko širi od pregleda koji je dat u ovom poglavlju doktorske disertacije. Iako se, pored modela binarnog izbora, modeli za odsečene i cenzurisane podatke takođe ubrajaju u modele zavisne promenljive sa ograničenjem, u disertaciji im je posvećena veća pažnja, budući da se ovi modeli najčešće koriste u empirijskom modeliranju zarada i višestrukog izbora zaposlenja. Pregled ekonometrijskih modela zavisne promenljive sa ograničenjem koji se koriste u modeliranju uporednih podataka, kao i podataka panela su dali: Amemiya (1985), Maddala (1987), Mátyás i Sevestre (1996), Verbeek (2002), Hsiao (2003), Baltagi (2013), Cameron i Trivedi (2005), Wooldridge (2006), Greene (2012) i dr. U domaćoj literaturi, pregled ekonometrijskih modela diskretne zavisne promenljive za uporedne podatke je dat u Nojković (2007). 2.1.1 Modeli binarnog izbora 2.1.1.1 Prikaz osnovnih modela Model binarnog izbora 3 za uporedne podatke može da se izrazi u formi linearnog modela verovatnoće (en. linear probability model – LPM) na sledeći način: )()1( 'ii xFyP  , i=1,2,..,N, (2.1) gde iy označava zavisnu binarnu promenljivu koja uzima vrednost 1 ili 0 za i-tu jedinicu posmatranja, ix je (1xK) skup objašnjavajućih promenljivih koji uključuje i vektor jedinica,  je (Kx1) vektor nepoznatih parametara, a F(.) je odgovarajuća funkcija raspodele verovatnoće. )1( iyP je verovatnoća da binarna promenljiva iy 3 O modelima višestrukog izbora, kada zavisna promenljiva iy može uzeti vrednosti iz zatvorenog intervala  im,...,1,0 , pri čemu je im celi broj, videti više u Amemiya (1985: str. 286-311). Analiza razlika u zaradama i višestrukog izbora zaposlenja 13 uzme vrednost 1; analogno tome, 1- )1( iyP je verovatnoća da iy uzme vrednost 0. Na osnovu modela (2.1) se izračunava verovatnoća ishoda događaja kada iy uzima vrednost 1, tj. )1( iyP i određuje se uticaj različitih faktora na tu verovatnoću. Da bi se bolje razumeo LPM na kratko ćemo se osvrnuti na linearni regresioni model koji ima sledeći oblik: iii xy   ' , i=1,2,..,N. (2.1') Ukoliko bi se model (2.1') koristio u modeliranju binarne zavisne promenljive iy , to bi impliciralo da se 'ix interpretira kao verovatnoća koja je ograničena na vrednosti u intervalu [0,1]. Ovo bi nadalje značilo da se na vrednosti ix i parametre  postavljaju proizvoljna ograničenja (Amemiya 1985). Takođe, ozbiljan problem sa primenom linearnog regresionog modela u modeliranju binarne zavisne promenljive jeste da slučajna greška i nema normalnu raspodelu i da nije homoskedastična. Prvi problem proizlazi iz činjenice da je iy Bernulijeva slučajna promenljiva koja uzima dve vrednosti 1 i 0 za date vrednosti ix , tako da i slučajna greška i može da uzme samo dve vrednosti, i to '1 ix ako je iy =1 i  ' ix u slučaju da je iy =0. Drugi problem se javlja zbog toga što je varijansa Bernulijeve slučajne promenljive iy data sa )()( iiii xVarxyVar  , što implicira da je za iy =1 varijansa slučajne greške )1()( ''  iiii xxxVar  . Dakle, varijansa slučajne greške nije konstantna već zavisi od vektora objašnjavajućih promenljivih 'ix i parametara  , što znači da metod običnih najmanjih kvadrata (en. ordinary least squares – OLS) više ne daje najbolje linearne nepristrasne ocene parametara (Jovičić 1989). Zbog gore navedenih ograničenja, vrednosti ispod odgovarajuće raspodele verovatnoće F( 'ix ) ne leže u intervalu [0,1]. Analiza razlika u zaradama i višestrukog izbora zaposlenja 14 Problemi sa primenom modela (2.1), zbog njegove linearnosti u parametrima, doveli su do korišćenja nelinearnih modela u analizi binarnog izbora. Dve osnovne nelinearne specifikacije su probit i logit modeli (en. probit and logit models), koji se koriste za modeliranje binarnog izbora. Transformacija opšteg modela binarnog izbora uvođenjem latentne zavisne promenljive, *iy (en. latent dependent variable), 4 može da se izrazi na sledeći način: iii xy   '* , i=1,2,..,N, (2.2) gde se pretpostavlja da je slučajna greška modela i nezavisna od objašnjavajućih promenljivih i da ima normalnu raspodelu: i ~ N(0, 2  ). Pošto se * iy ne može opaziti, neophodno je izvršiti transformaciju modela (2.2) i tu promenljivu zameniti novom zavisnom promenljivom iy koja se opaža i koja se naziva indikator ili indeks: iy =1 ako je * iy >0, i=1,2,..,N, (2.3) =0 ako je *iy  0. Transformisana zavisna promenljiva iy po definiciji može uzeti vrednost 1 ili 0. Primena ove specifikacije u modeliranju binarnog izbora omogućava da se u modelu (2.3) opaža znak, ali ne i numerička vrednost latentne zavisne promenljive *iy . 5 Probit model proizlazi iz sledeće funkcije raspodele verovatnoće:        ' )()2/(exp)2()1( '22/1 ix ii xFdzzyP , i=1,2,..,N. (2.4) 4 Statistički modeli binarnog izbora imaju svoje ishodište u ekonomskoj teoriji i funkcijama korisnosti (en. utility functions). Tako su ovi modeli, na primer, našli svoju primenu u modeliranju izbora koji određeni pojedinac čini kada donosi odluku o tome da li će učestvovati na tržištu rada ili ne (zavisna promenljiva od interesa) u zavisnosti od toga da li je ponuđena zarada veća od očekivane ili “rezervacione” zarade (tj. “cene u senci” vremena) koju je dati pojedinac spreman da prihvati (latentna zavisna promenljiva). Ekonomski modeli će biti detaljnije izloženi u poglavlju 4. 5 Vrednost 0 u modelu (2.3) može biti zamenjena bilo kojom drugom proizvoljnom vrednošću tako da se iz ove specifikacije mogu izvoditi i drugi modeli zavisne promenljive sa ograničenjem (Amemiya 1985). Analiza razlika u zaradama i višestrukog izbora zaposlenja 15 U modelu (2.4), F(.) je funkcija raspodele verovatnoće u slučaju da iy uzima vrednost 1, dok je z standardizovana normalno raspodeljena slučajna promenljiva. Pod pretpostavkom da slučajna greška modela verovatnoće, koja predstavlja razliku između ostvarivanja dve alternative binarnog izbora, 6 ima standardizovanu normalnu raspodelu sa parametrima (0,1), specifikacija (2.4) odgovara probit modelu. Logit model se izražava na sledeći način: )()]exp(1/[)exp()1( ','  iiii xFxxyP  , i=1,2,..,N. (2.5) Osnovna razlika u odnosu na probit model je u tome što slučajna greška umesto standardizovane normalne raspodele sa varijansom jednakom 1, sada ima logističku raspodelu sa parametrima (0, 3/2 ). 2.1.1.2 Model binarnog izbora sa fiksnim efektima Model binarnog izbora sa fiksnim efektima (en. binary choice fixed effects model) se koristi za modeliranje podataka mikro panela. Mali broj vremenskih tačaka, tokom kojih se prate jedinice posmatranja u mikro panelima, predstavlja veliko ograničenje u primeni modela binarnog izbora, zbog problema u ocenjivanju poznatog pod nazivom “problem sporednih parametara” (en. incidental-parameter problem) (Neyman i Scott 1948). Pristup ovom problemu će u nastavku izlaganja biti ilustrovan na primeru modela binarnog izbora sa fiksnim efektima. Polazeći od modela binarnog izbora za uporedne podatke (2.2) i (2.3), model binarnog izbora sa fiksnim efektima za podatke panela prikazuje se na sledeći način (Hsiao 2003): 6 Iz modela (2.2) i (2.3) proizlazi da će verovatnoća da je iy =1 biti definisana na sledeći način: P( * iy >0)=P( iix   ' >0)=P( i >-  ' ix ). Analogno tome, moguće je definisati verovatnoću da se ostvari suprotan događaj (Greene 2012). Analiza razlika u zaradama i višestrukog izbora zaposlenja 16 ity =1 ako je it '*   iitit xy >0, i=1,2,..,N, t=1,2,..,T, (2.6) =0 ako je *ity  0. U specifikaciji (2.6), 'itx ( ),...,( 1 ' iTiit xxx  je (TxK) skup objašnjavajućih promenljivih i- te jedinice posmatranja u periodu t,  predstavlja (Kx1) vektor nepoznatih parametara koji uključuje i zajedničku konstantu 0 , i ( )',...,( 1 Ni   ) 7 predstavlja individualne efekte (ili efekte promenljivih čije se vrednosti menjaju po i, a konstantne su tokom vremena), 8 dok je it slučajna greška nezavisna od skupa objašnjavajućih promenljivih itx ( it ~ 0)( itE  ; 22 )()(   itit VE ). Model (2.6) može da sadrži i vremenske efekte t (efekte iz modela izostavljenih vremenskih promenljivih). Osim modela (2.6) definisanog za balansirane podatke panela, postoje i njegove modifikacije za nebalansirane panele, u kojima broj jedinica posmatranja varira kroz vreme (Honoré 2002). Vredno je osvrnuti se na klasični linearni model panela sa fiksnim efektima u kojem se ocenjivanje regresionih parametara  može sprovesti korišćenjem najmanje tri standardne procedure (videti npr. Dragutinović Mitrović 2002; Baltagi 2013). Prva se bazira na modelu panela sa veštačkim promenljivim (en. least squares dummy variable model – LSDV), gde se uticaj individualnih efekata modelira uključivanjem N konstanti (ili veštačkih promenljivih), a model sa fiksnim efektima se ocenjuje metodom OLS. Druga procedura se zasniva na modelu prvih diferenci koji se svodi na: 1,it ' 1, ' 1, )(   titiittiit xxyy  , (2.6') 7 Kada se u model binarnog izbora za podatke panela uvodi pretpostavka da su i fiksni parametri, time se ne podrazumeva da ovi parametri mere odstupanja od zajedničke aritmetičke sredine, već je time moguće odvojeno posmatrati prosečno od individualnog ponašanja, dok se u modelima binarnog izbora sa slučajnim efektima pretpostavlja da je 0)(  i (Dragutinović Mitrović 2002; Hsiao 2003). 8 U nastavku izlaganja, ukoliko nije drugačije navedeno, i će izražavati individualne efekte ili neopažene osobine, kao što su sposobnost ili predeterminisane karakteristike date jedinice posmatranja (en. unobserved effects ili unobserved individuals' ability) koje su uglavnom konstantne kroz vreme (Wooldridge 2006; Angrist i Pischke 2009). Analiza razlika u zaradama i višestrukog izbora zaposlenja 17 gde se individualni efekti i potiru uvođenjem operatatora prvih diferenci ( 1,  tiitit yyy ), tako da u modelu (2.6') ostaju samo regresioni parametri  koji se ocenjuju metodom OLS ili metodom uopštenih najmanjih kvadrata (en. generalized least squares – GLS). Kao alternativa pomenutim pristupima može da se primeni transformacija polaznog modela, uvođenjem odstupanja od individualnih proseka, tako da se dobija sledeći linearni panel model: )( )( it ' iiitiit xxyy   , (2.6'') gde su    T t iti y T y 1 1 ,    T t iti x T x 1 1 i    T t iti T 1 1  , a rezultat su uprosečavanja skupa zavisnih i objašnjavajućih promenljivih i stohastičkog člana modela kroz vreme. Ovom transformacijom se takođe eliminišu individualni efekti i . Primena metoda OLS u ocenjivanju transformisanog modela (2.6'') se naziva kovarijacionim metodom ocenjivanja (en. covariance estimator) ili metodom ocenjivanja unutar grupa (en. within group estimator), sa ocenama koje su dobijene na bazi varijabiliteta unutar jedinica posmatranja (en. within group estimate). Ovaj metod ocenjivanja se takođe naziva i metodom apsorpcije fiksnih efekata (Angrist i Pischke 2009). 2.1.1.3 Model binarnog izbora sa slučajnim efektima Model binarnog izbora sa slučajnim efektima (en. binary choice random effects model) može da se izrazi sledećom notacijom: ity =1 ako je it '* uxy itit   >0, i=1,2,..,N, t=1,2,..,T, (2.7) it  iitu =0 ako je *ity  0. Osnovna razlika u odnosu na model binarnog izbora sa fiksnim efektima je da su u specifikaciji (2.7) individualni efekti i obuhvaćeni kompozitnom slučajnom greškom Analiza razlika u zaradama i višestrukog izbora zaposlenja 18 itu . Dakle, kompozitna slučajna greška itu u modelu (2.7) se dekomponuje na: (i) individualne efekte i i (ii) na ostatak slučajne greške it . Model (2.7) se zasniva na sledećem skupu osnovnih pretpostavki: (i) i ~ IID (0, 2  ) i it ~ IID (0, 2  ); (ii) 0),( itiCov  za  (i, t); (iii) i i it su nezavisne od itx ( 0)|( iti xE  i 0)|( itit xE  za  t). 9 Međutim, pošto se varijansa kompozitne slučajne greške 22)(   ituVar u modelima binarnog izbora svodi na 22 1)()(  itit uVaruE , prisustvo varijanse individualnih efekata, 2 , u varijansi kompozitne slučajne greške modela binarnog izbora, ne omogućava da se zajednička funkcija verodostojnosti latentne zavisne promenljive izrazi kao produkt marginalnih funkcija verodostojnosti od ity i usložnjava primenu metoda maksimalne verodostojnosti u ocenjivanju modela binarnog izbora (Baltagi 2013). Vredno je pomenuti da je u ekonometrijskoj literaturi razvijeno nekoliko standardnih metoda ocenjivanja klasičnog linearnog modela panela sa slučajnim efektima (videti npr. Dragutinović Mitrović 2002; Baltagi 2013). Najčešće korišćeni metod je metod uopštenih najmanjih kvadrata sa komponentama slučajnih grešaka (en. error components generalised least squares), po kojem se ocena regresionih parametara ˆ dobija kao ponderisani prosek dveju ocena, 10 jedne koja meri objašnjeni deo varijabiliteta unutar jedinica posmatranja (kovarijaciona ocena) i druge koja objašnjava varijabilitet između jedinica posmatranja (ocena između jedinica posmatranja (en. between group estimate)). Maddala (1987) ukazuje na sledeće uslove u kojima se biraju modeli panela sa slučajnim efektima umesto modela panela sa fiksnim efektima: (i) ukoliko je N veliki broj, umesto ocenjivanja (N-1) fiksnih parametara i u modelu sa fiksnim efektima, u modelu sa slučajnim efektima se ocenjuju samo prosečna vrednost slobodnih članova i varijansa, što dovodi do značajne uštede u broju stepeni slobode i povećanja efikasnosti 9 Ova poslednja pretpostavka se smatra restriktivnom za primenu modela binarnog izbora sa slučajnim efektima u empirijskim studijama (Baltagi 2013), a posvećeno joj je više pažnje u tački 2.1.2.2. 10 Kao ponderi se koriste inverzne vrednosti odgovarajućih varijansi (Baltagi 2013). Analiza razlika u zaradama i višestrukog izbora zaposlenja 19 ocena; (ii) ako se i tretira kao slučajna promenljiva na osnovu koje se žele dobiti informacije o osnovnom skupu iz kojeg je izabran uzorak panela; (iii) pošto i meri specifične efekte i-te jedinice posmatranja koji nisu obuhvaćeni skupom posmatranih nezavisnih promenljivih (i ne mogu se opaziti), opravdano je tretirati ih kao slučajne promenljive, tj. deo slučajne greške; (iv) u slučaju mikro panela koji, pored i , sadrže i druge promenljive koje su vremenski invarijantne (na primer, nivo obrazovanja, zanimanje, region, pol i dr.; it '' uxzy itiit   , it  iitu , i=1,...,N, t=1,..,T), primenom metoda za modele sa fiksnim efektima ne mogu da se ocene regresioni parametri  uz individualne promenljive iz . 2.1.2 Parametarski metodi ocenjivanja 2.1.2.1 Osnove metoda maksimalne verodostojnosti U ocenjivanju statističkih probit i logit modela za uporedne podatke koristi se metod maksimalne verodostojnosti (en. maxiumum likelihood – ML).11 Funkcija gustine verovatnoće binarne slučajne promenljive se izražava na sledeći način:     ii yii y iii xyPxyPyf   1 )0()1()( , i=1,2,..,N. (2.8) Za slučajan uzorak od N jedinica posmatranja, i=1,2,..,N, moguće je definisati zajedničku funkciju verodostojnosti kao proizvod svih verovatnoća da se ostvari pozitivan ishod zavisne promenljive iy za dati skup objašnjavajućih promenljivih ix :     ii yi y i N i ii xFxFxyl    1'' 1 )(1)(),;(  . (2.9) Funkcija verodostojnosti, u logaritamskoj formi, definiše se na sledeći način: 11 Više o statističkim svojstvima metoda maksimalne verodostojnosti videti npr. u Milošević (1990: str. 241-243). Analiza razlika u zaradama i višestrukog izbora zaposlenja 20  })(1log)1()(log{),;(log '' 1  iii N i iii xFyxFyxyl   . (2.10) Na osnovu jednačine (2.10), a polazeći od utvrđenih funkcija raspodele verovatnoće, funkcija verodostojnosti za probit model glasi:    N i iiiiii xyxyxyl 1 '' )]}(1log[)1()(log{),;(log  , (2.11) dok je odgovarajuća funkcija verodostojnosti za logit model:       N i i i i i iii x y x x yxyl 1 '' ' } )exp(1 1 log)1( )exp(1 )exp( log{),;(log    . (2.12) Primena metoda ML u izračunavanju ocena nepoznatih parametara  se zasniva na iterativnoj proceduri primene Newton-Raphson-ovog metoda optimizacije. Ako je odgovarajuća logaritamska funkcija verodostojnosti konkavna, ovim metodom se izračunavaju vrednosti ocena nepoznatih parametara  koje maksimiziraju funkciju verodostojnosti. Primena ovog metoda konvergira maksimalnoj vrednosti date funkcije verodostojnosti nakon određenog broja iteracija. Ocene parametara i varijanse ocena dobijene po ovom metodu imaju poželjne asimptotske statističke osobine. Izračunata Hesijan matrica drugih izvoda, '2 /)(log   l , uvek je negativno definitna, tako da primena ovog metoda optimizacije dovodi do globalne konkavnosti odgovarajuće funkcije verodostojnosti, za proizvoljne vrednosti početnih ocena parametara 0ˆ (Hsiao 2003). Ocene parametara u modelima binarnog izbora proizlaze iz prvog izvoda verovatnoće ostvarenja događaja da je iy = 1 u odnosu na datu objašnjavajuću promenljivu iz skupa promenljivih ix . Marginalni efekti, tj. efekti jedinične promene u objašnjavajućoj promenljivoj na ostvarenje pozitivnog ishoda događaja da je iy = 1, ne mogu da se direktno interpretiraju iz ocenjenih probit i logit modela. U slučaju da se marginalni Analiza razlika u zaradama i višestrukog izbora zaposlenja 21 efekti izračunavaju za neprekidne promenljive, ostale objašnjavajuće promenljive u modelu se fiksiraju u srednjoj vrednosti, a formule za izračunavanje marginalnih efekata za probit i logit modele su date: Kix  ˆ)ˆ( ' i Kii xx  ˆ]))ˆexp(1/()ˆ[exp( 2''  , respektivno. U modelima sa diskretnim objašnjavajućim promenljivim, marginalni efekti se izračunavaju kao razlika između ocenjenih verovatnoća ostvarenja pozitivnog ishoda da je iy = 1 za vrednost date diskretne promenljive 1 odnosno 0, pri čemu su ostale objašnjavajuće promenljive u modelu konstantne. Predviđene verovatnoće da zavisna promenljiva uzme vrednost 1, kao odgovor na promenu u objašnjavajućoj promenljivoj, u slučaju probit modela, ili u odnosu na količnik predviđenih verovatnoća ishoda dvaju suprotnih događaja  )0(/)1(log  ii yPyP , u slučaju logit modela, mogu da se izračunaju u tipičnoj vrednosti ostalih diskretnih promenljivih u modelu.12 2.1.2.2 Metodi ocenjivanja modela binarnog izbora U modelima binarnog izbora sa fiksnim efektima standardni metodi ocenjivanja (kao što su metod OLS sa veštačkim promenljivim za individualne efekte, kovarijacioni metod ili metod OLS sa prvim diferencama) ne mogu da se primene da bi se dobile ocene parametara  koje su nezavisne od fiksnih parametara i . Hsiao (2003: str. 194-195) je na primeru primene metoda maksimalne verodostojnosti u ocenjivanju logit modela pokazao da se nekonzistentnost ocena iˆ direktno odražava na nekonzistentnost ocenjenih parametara ˆ u uzorcima podataka panela kada je T konačno i N , pošto, za 2/ˆ  i , ocena strukturnih parametara ˆ postaje nekonzistentna, tj.  2ˆlim  N p . Budući da porast broja fiksnih parametara sa povećanjem broja opservacija u modelima panela dovodi do narušavanja asimptotskih osobina ocena ˆ po metodu ML, Andersen (1970) je predložio rešenje kojim se sporedni parametri, tj. individualni efekti i eliminišu iz uslovne funkcije verodostojnosti, a umesto njih se uvodi uslov minimalno 12 Pored metoda ML, razvijeni su i drugi metodi ocenjivanja modela binarnog izbora (videti npr. Berkson (1944, 1980) za logit model i Amemiya (1985) za probit model). Analiza razlika u zaradama i višestrukog izbora zaposlenja 22 dovoljne statistike   T t ity 1 , i=1,..,N. Po definiciji minimalno dovoljne statistike, raspodela podataka od ity ne zavisiti od i (Baltagi 2013). Metod ocenjivanja uslovne funkcije verodostojnosti, u tom slučaju, naziva se metodom uslovne ML (en. conditional maximum likelihood – CLM), koji pod strogim pretpostavkama: (i) da je uslovna funkcija verodostojnosti diferencijabilna u odnosu na regresioni parametar  i (ii) da postoji jedinstveno rešenje za ocenu regresionog parametra ˆ , daje asimptotski normalne i konzistentne ocene ˆ . Polazeći od postavke koju su predložili Andersen (1970) i Chamberlain (1980), uslovna funkcija gustine za logit model sa fiksnim efektima (en. fixed effects logit model) glasi:                      iBd T t itit T t itit i T t iti dx yx xyyf 1 ' 1 ' 1 exp exp ),,(    , i=1,..,N, t=1,..,T. (2.13) Iz uslovne funkcije gustine (2.13) se izvodi uslovna funkcija verodostojnosti    T t it N i it c yyl 11 )|( na osnovu koje se primenom metoda CLM ocenjuju nepoznati parametri  . Suština definisanja funkcije gustine (2.13) leži u tome da ne sadrži fiksne efekte i , čime je eliminisana heterogenost između jedinica posmatranja u panelu i što je omogućeno uvođenjem uslova   T t ity 1 = s. Dakle, ako se pođe od pretpostavke da za svaku i-tu opservaciju tokom perioda T postoji    T t it sy 1 ishoda u kojima ova opservacija uzima vrednost 1, definisanjem skupa }|{ 11    T t it T t itii syddB , svih mogućih ishoda čije su vrednosti 1 i 0 i za koje je suma T binarnih ishoda jednaka    T t it sy 1 , eliminiše se i iz uslovne funkcije verodostojnosti, te se logit model može Analiza razlika u zaradama i višestrukog izbora zaposlenja 23 konzistentno oceniti. Međutim, postoji i nekoliko ograničenja u primeni ovog pristupa. Funkciju verodostojnosti cl nije moguće definisati za uslove: (i)    T t ity 1 0 , pošto i-ta opservacija kroz svih t=1,...,T vremenskih tačaka uzima vrednost nula, kao ni za (ii)    T t it Ty 1 iz istog razloga, tj. ne razmatraju se i-te opservacije za koje vrednost ishoda ostaje nepromenjena tokom posmatranog vremenskog perioda T, pošto zajedničkoj funkciji verodostojnosti doprinose sa vrednošću nula. Dakle, razmatra se samo s=1,2,...,T-1 skupova ishoda. Ukupan broj alternativa određuje se po principu )!(! ! sTs T  . Iz ovoga proizlazi i drugo ograničenje, a ono se ogleda u činjenici da za veliko T postoji veliki broj alternativa sa parovima ishoda (1,0). Na primer, za T=2 i s=1, moguća su dva ishoda za binarnu zavisnu promenljivu ity , u odnosu na koje se definiše uslovna funkcija verovatnoće, dok se za T=10 i s=1 broj alternativa povećava na deset. Predloženo je nekoliko rešenja, od kojih se izdvajaju dva: (i) da se smanji broj ishoda isključivanjem opservacija sa velikim brojem alternativa, ili (ii) da se smanji dužina vremenskog perioda T. Međutim, Cameron i Trivedi (2005) navode da primena ovih rešenja može dovesti do gubitka značajnog broja opservacija i do smanjenja efikasnosti ocena ˆ . U opštem slučaju kada je T>2 i   T t ity 1 , i=1,...,N, uslovna funkcija verodostojnosti za logit model glasi:          N i Bd T t itit N i T t itit c ii dx xy l 1 1 ' 1 1 ' ]})log{exp[( })]log{exp[( log   , (2.14) Analiza razlika u zaradama i višestrukog izbora zaposlenja 24 pri čemu se skup ishoda za i-tu opservaciju B sada definiše na sledeći način: 0|),...,({ 1  itiTiii ddddB ili 1 i } 11    T t it T t it yd . Maksimizacijom funkcije (2.14) dobijaju se uslovne logit ocene regresionih parametara ˆ . Chamberlain (1980: str. 229-230) je pokazao da u asiptotskom slučaju kada N postoji informaciona matrica )|/log( ,2 BlEJ cB  koja, polazeći od uslovne funkcije verodostojnosti i primene metoda CLM u ocenjivanju nepoznatih parametara  , omogućava da se izračuna asimptotska matrica kovarijansi '21 /log  clJ B . Drugim rečima, primena metoda ocenjivanja CLM se sada svodi na primenu regularnog metoda ML u ocenjivanju logit modela za uporedne podatke koji je izložen u tački 2.1.2.1. Kada je model sa slučajnim efektima racionalan izbor za modeliranje diskretne zavisne promenljive u podacima panela, tj. kada se efekti i tretiraju kao slučajne promenljive, koriste se probit modeli (en. random effects probit models). Pošto je u modelu binarnog izbora sa slučajnim efektima (2.7), slučajna greška itu dekomponovana na efekte i i ostatak slučajne greške it , ocenjivanje ovih modela zahteva ispunjenost pretpostavki o svakoj komponenti, kao i o kompozitnoj grešci itu : (i) 0)|( itit xE  i 1)|()|,(  itititisit xVarxCov  , ako je i=j i t=s, i 0 inače; (ii) 0)|( iti xE  i 2)|()|,(   itiitji xVarxCov , ako je i=j, i 0 inače. Ove pretpostavke nadalje impliciraju nezavisnost između i i itx skupa objašnjavajućih promenljivih – što je osnovni uslov na kojem počiva specifikacija probit modela sa slučajnim efektima13 – kao i odsustvo korelisanosti između komponenti slučajne greške ( 0)|,( itjit xCov  za  (i, j i t)). Iz ovoga proizlazi sledeće: 0)|( itit xuE , 13 Ovom pretpostavkom se uvodi osnovna razlika između logit modela sa fiksnim efektima i probit modela sa slučajnim efektima. Stroge pretpostavke o nezavisnosti i i itx , kao i pretpostavka da i ima normalnu raspodelu sa očekivanom vrednošću 0)( iE  , impliciraju da skup promenljivih itx sadrži i (Nx1) vektor jedinica, čime je omogućeno da se prosečna vrednost slobodnih članova populacije iz koje je biran uzorak jedinica posmatranja N, i=1,...,N, oceni nezavisno od i (Hsiao 2003). Analiza razlika u zaradama i višestrukog izbora zaposlenja 25 21)|( itit xuVar i 2 2 1 )|,(       itisit xuuCov za  i i t  s (Baltagi 2013). Na osnovu koeficijenta korelacije  između uzastopnih grešaka za i-tu opservaciju, varijansa od i se može izračunati kao količnik       1 2 . Polazeći od navedenih pretpostavki, funkciju uslovne raspodele verovatnoće je moguće izraziti na sledeći način (Butler i Moffitt 1982): it G D ititit duufxiliyP it it  )()|)10(( , i=1,2,..,N, t=1,...,T, (2.15) gde su donja i gornja granica integrala određene u zavisnosti od toga da li ishod diskretne zavisne promenljive ity uzima vrednost 0 ili 1: ako je 0ity sledi ),(),( ' ititit xGD  , a ako je 1ity biće ),(),( '  ititit xGD . Stoga se, prema Butler-u i Moffitt-u (1982), odgovarajuća funkcija verodostojnosti i-te opservacije za ceo vremenski period T definiše kao što sledi:   it it i i G D G D itiitiititi duduuufxyyl 1 1 ,...,),...,(...)|,...,( 111 . (2.16) Pod pretpostavkom da su itu međusobno nezavisne u odnosu na i sledi funkcija gustine verovatnoće za normalnu raspodelu slučajne greške:      T t iiiititi dfufuuf 1 1 )()|(),...,(  . (2.17) Uključivanjem (2.17) u (2.16) i promenom redosleda u funkciji višestrukog integrala reda T, dolazi se do funkcije verodostojnosti u sledećem obliku (Greene 2012): Analiza razlika u zaradama i višestrukog izbora zaposlenja 26                ii T t G D itiitititi duufduufxyyPl it it )())|(()|,...,( 1 1  . (2.18) Budući da vrednosti ispod integrala predstavljaju umnožak individualnih verovatnoća u opštem slučaju, ukoliko se funkcija verodostojnosti želi prikazati za odgovarajući model binarnog izbora, funkcije raspodele verovatnoće .)|( ityP se izračunavaju za svako t=1,...,T u iitx   ' : ii T t iititititi duufxyPxyyPl )()|()|,...,( 1 ' 1              . (2.19) Da bi maksimizacija funkcije verodostojnosti (2.19) bila računski izvodljiva potrebno je naći rešenje za sumu proizvoda unutar neodređenog integrala. Butler i Moffitt (1982) su predložili primenu Gauss-ove kvadrature, pošto slučajna promenljiva i ima normalnu raspodelu, te se zadovoljavajuće rešenje integrala postiže primenom numeričke integracije pomoću Hermit-ove integracione formule. Ovaj metod je, dakle, komplikovan jer njegova primena zahteva izbor broja tačaka u kojima vrednosti integranda moraju da se izračunaju da bi se dobila tačna aproksimacija, a primena je ograničena ukoliko nisu ispunjene pretpostavke o normalnoj raspodeli i i o konstantnoj korelisanosti grešaka itu za jedinicu posmatranja i, u bilo koja dva vremenska perioda t i s ( st  ). Zbog toga se u empirijskim studijama koriste i ekonometrijske specifikacije koje se baziraju na manje restriktivnim pretpostavkama o komponenti slučajne greške (Baltagi 2013). U teorijskoj ekonometrijskoj literaturi se predlažu i drugi algoritmi maksimizacije funkcije verodostojnosti da bi se izbegao problem numeričke integracije i pronalaženja odgovarajuće aproksimacije bliskog integrala (videti npr. Gourieroux i Monfort 1991). Jedan metod sugeriše da se maksimum date funkcije verodostojnosti traži simulacijom umesto numeričkom integracijom, za šta je potrebno funkciju verodostojnosti (2.19) iskazati u formi očekivanja za odgovarajuću funkciju raspodele verovatnoće .)|( ityP : Analiza razlika u zaradama i višestrukog izbora zaposlenja 27          T t iitit xyPEl 1 ' )|(  , (2.20) a zatim primeniti metod simulacije maksimalne verodostojnosti (en. maximum simulated likelihood – MSL). Maksimizacija uslovne funkcije verodostojnosti za uzorak od N jedinica posmatranja, sprovodi se u odnosu na regresioni parametar  i varijansu 2  za normalnu raspodelu (Greene 2012). Pod ovim uslovima, funkcija verodostojnosti (2.20) se svodi na izraz: )]([),( 1 ' i T t iitit gExyFEl           , (2.21) gde je  nepoznati parametar u funkciji raspodele slučajne promenljive i . Metod simulacije podrazumeva da se koristi generator slučajnih brojeva koji omogućava da se iz populacije i izvuče poduzorak opservacija veličine im , im =1,..., iM , tako da za normalno raspodeljenu slučajnu promenljivu i , funkcija verodostojnosti u logaritamskoj formi ima sledeći izraz:                    N i M m T t imitik i s i i i xyF M l 1 1 1 ' ))(12( 1 loglog   , (2.22) i=1,...,N, t=1,...,T , im =1,..., iM . Dokazi na osnovu kojih su izvedene ocene regresionih parametara ˆ i odgovarajuće ocene matrice varijansi i kovarijansi ˆ , detaljno su predstavljeni u Butler i Moffitt (1982) i Greene (2012) sa primerima ocenjivanja modela panela. Pored gore navedenih metoda ocenjivanja probit modela sa slučajnim efektima, koriste se i drugi metodi. Na primer, Chamberlain (1980) je proširio prvobitni probit model sa slučajnim efektima uključivanjem člana ix koji meri zavisnost između i i itx u specifikaciji binarne latentne zavisne promenljive: itiitit xxy   i ' 0 * [ ity =1 Analiza razlika u zaradama i višestrukog izbora zaposlenja 28 ako je *ity >0]. Ovim uslovom se narušava stroga pretpostavka o nezavisnosti objašnjavajućih promenljivih od i komponente slučajne greške. Na osnovu ocenjenog slobodnog člana 0ˆ i ocena parametara ˆ uz prosečne vrednosti objašnjavajućih promenljivih moguće je oceniti i i . Pošto je očekivana vrednost od i data kao  )()( 0 ii xEE  , proizlazi da je ocena od  jednaka  ˆ ˆˆ 0 x , gde je x prosečna vrednost od ix za ceo uzorak N. 2.1.3 Poluparametarski metodi ocenjivanja U ovoj tački će biti prikazati poluparametarski metodi ocenjivanja modela binarnog izbora za uporedne i panel podatke. Jedan od poluparametarskih metoda ocenjivanja modela binarnog izbora za uporedne podatke koji daje konzistentne i efikasne ocene strukturnih parametara ˆ pod pretpostavkama o asimptotskoj normalnosti (ocena ˆ teži stvarnoj vrednosti nepoznatog parametra  po (bržoj) stopi konvergencije 2/1N , kada N ), zasniva se na primeni tzv. metoda adaptivnog jezgra (en. adaptive kernel estimator) i maksimizaciji kvazi funkcije verodostojnosti (Klein i Spady 1993). Pri definisanju osobina poluparametarskog metoda ocenjivanja modela binarnog izbora, Klein i Spady (1993) su pošli od tzv. jednoindeksnog modela (en. single-index models) koji, za razliku od standardnih modela binarnog izbora, ne zahteva da su unapred poznati parametri raspodele slučajne greške.14 Formalna procedura testiranja dveju specifikacija modela binarnog izbora, parametarske i poluparametarske, primenom testa koji su razvili Horowitz i Härdle (1994), potvrdila je superiornost poluparametarske specifikacije u smislu efikasnosti ocena u konačnim uzorcima sa dovoljnim brojem jedinica posmatranja (Martins 2001). Ovaj metod ocenjivanja će biti detaljnije prikazan u nastavku izlaganja. Alternativni poluparametarski metodi ocenjivanja jednoindeksnog regresionog modela razvijeni su u Ichimura (1993). Pregled poluparametarskih metoda ocenjivanja u modelima binarnog izbora za uporedne podatke je dat, na primer, u Hsiao (2003), Wooldridge (2006), Greene (2012) i dr. 14 Poluparametarski metod Klein-a i Spady-a (1993) primenjen je u ocenjivanju funkcija ponude rada žena (videti npr. Martins 2001; Ognjenović 2013). Analiza razlika u zaradama i višestrukog izbora zaposlenja 29 Među poluparametarske metode ocenjivanja modela binarnog izbora za podatke panela ubrajaju se metodi maksimalnog broja pogodaka (en. maximum score estimator), izravnatog maksimalnog broja pogodaka (en. smoothed maximum score estimator) i N konzistentni metod ocenjivanja (en. Root-N estimator) koje su razvili Manski (1987), Horowitz (1992) i Lee (1999), respektivno, i drugi slični metodi za grupisane podatke (Collado 1998). Poluparametarski pristup u tretiranju modela binarnog izbora uvodi fleksibilnost u definisanje raspodele slučajne greške, odnosno pogodnosti koje se ogledaju u činjenici da nije a priori potrebno specifikovati teorijsku raspodelu slučajne greške it modela, te da konzistentno ocenjivanje nepoznatih parametara  ne zavisi od toga da li se individualni efekti i tretiraju kao fiksni ili slučajni efekti. Primena poluparametarskog metoda maksimalnog broja pogodaka zasniva se na sledećim pretpostavkama (Manski 1987): (i) slučajna greška it je stacionarna (nezavisna i identična raspodela u bilo koje dve vremenske tačke t i s, ako je t≠s) i nezavisna od ( itx , i ); (ii) u skupu objašnjavajućih promenljivih mora da bude najmanje jedna kontinuelna promenljiva sa parametrom različitim od 0 da bi vektor nepoznatih parametara  mogao da se identifikuje. Poslednja pretpostavka implicira da se vektor nepoznatih parametara  može identifikovati na bazi normalizacije 1*  , pri čemu je * vektor normalizovanih parametara takav da je  /*  . Uz ove dve pretpostavke, podrazumeva se i to da je slučajan uzorak od N’ nezavisnih realizacija takav da se svakom članu od n’, n’=1,...,N’, pridružuju numerička obeležja koja čine skup promenljivih itx posmatranih u određenom vremenskom intervalu. U postavci poluparametarskog modela, Manski (1987) polazi od standardnog uslova kojim se promenljivoj ity dodeljuje vrednost jedan, ako je latentna zavisna promenljiva * ity >0 i vrednost nula nasuprot tome, što je slično postavci modela binarnog izbora sa slučajnim efektima (2.7), gde je slučajna greška it  iitu . Postupak ocenjivanja nepoznatih parametara  pomoću metoda maksimalnog broja pogodaka se zasniva na Analiza razlika u zaradama i višestrukog izbora zaposlenja 30 primeni funkcije znaka, pri čemu se očekivana vrednost zavisne promenljive dobija pomoću znaka latentne promenljive i maksimizira se broj tačnih pogodaka. Dakle, ocenjivanje nepoznatih parametara  se zasniva na kombinovanju opservacija u posmatranom t i nekom ranijem t-1 periodu, tako da se može postaviti u formi prvih diferenci: 'itx >=<0 )|( itit xyE  >=<0, u smislu da znak (>, =, <) u odnosu na 0 proizvodi ekvivalentnu relaciju uslovne očekivane vrednosti od ity . Budući da poluparametarski pristup, kao što je već navedeno, ne podrazumeva stroge pretpostavke o slučajnom članu modela, kao u parametarskom pristupu, latentnu zavisnu promenljivu je moguće izraziti kao linearnu funkciju objašnjavajućih promenljivih, tako da se operatorom prvih diferenci mogu eliminisati individualni efekti iz početnog aditivnog modela, a da se ne naruši konzistentnost ocena nepoznatih parametara  . Za bilo koje Kb  , koje zadovoljava uslov normalizacije 1' bb , takvo da je *b , razmatra se sledeća funkcija:     N i itititb yybx N g 1 1 ' ))((sgn 1 . Dakle, b se bira na takav način da je znak od )( ' bxit jednak znaku od )( 1 itit yy za što veći broj opservacija je moguće, tako da postoji jedinstveno rešenje za * . Iz procedure ocenjivanja se eliminišu one opservacije za koje je 1 itit yy , tj. opservacije koje ne menjaju stanje između dva posmatrana vremenska perioda i koje ne utiču na maksimizaciju funkcije bg . Metod ocenjivanja kojim se maksimizira funkcija bg rezultuje maksimalnim pogotkom primenjenim na one opservacije koje su promenile stanje prelaskom iz vremenske tačke t-1 u vremensku tačku t za dati skup objašnjavajućih promenljivih. Primenom ovog metoda dobijaju se konzistentne, ali ne i normalno raspodeljene i asimptotski efikasne ocene ˆ (Hsiao 2003). Nasuprot tome, metod izravnatog maksimalnog broja pogodaka rezultuje konzistentnim i asimptotski normalnim ocenama, čija stopa konvergencije iznosi najmanje 5/2N , a u zavisnosti od izbora parametra izravnanja Nh (en. bandwidth parameter) može se postići stopa konvergencije približna 2/1N (Horowitz 1992). Metod je sličan metodu maksimalnog broja pogodaka, ali umesto funkcije znaka )sgn( ' bxit koristi se kontinuelna funkcija izravnanja )/( ' Nit hbxK  , gde je Nh parametar izravnanja. Od izbora vrednosti parametra Nh zavisiće koliko su Analiza razlika u zaradama i višestrukog izbora zaposlenja 31 raspodele slučajne greške it i bxit ' bliske normalnoj raspodeli. Lee (1999) je takođe razvio konzistentan poluparametarski metod ocenjivanja nepoznatih parametara  koji omogućava izračunavanje asimptotske matrice varijansi i kovarijansi pod uslovom da je izvršena normalizacija vektora parametara, takva da je 11  . Ovaj metod se bazira na stopi konvergencije parametara od 2/1N , te se stoga i naziva N konzistentni metod ocenjivanja. Međutim, nedostatak ovih metoda ocenjivanja je da se efekti uz individualne (vremenski invarijantne) promenljive ne mogu oceniti, kao ni vremenske (individualno invarijantne) nezavisne promenljive. Prvi skup nezavisnih promenljivih se eliminiše prvim diferencama između istih jedinica posmatranja ixi  , , a drugi prvim diferencama između različitih jedinica posmatranja jixx ji  , , pri čemu  meri razliku u vrednosti date promenljive između dva vremenska perioda 1t i 2t . Polazeći od specifikacije modela binarnog izbora sa slučajnim efektima, Collado (1998) pokazuje da primena metoda ocenjivanja koji se bazira na izračunavanju minimalne udaljenosti između grupa ili kohorti (en. minimum distance estimator),15 kao i metoda na bazi varijabiliteta unutar jedinica posmatranja ili grupa (en. within group estimator), daje konzistentne ocene regresionih parametara ˆ . Oba metoda ocenjivanja se primenjuju na podacima koji formiraju pseudo panele. U definisanju metoda ocenjivanja na bazi minimalne udaljenosti, Collado (1998) polazi od parametarizacije uslovne očekivane vrednosti individualnih efekata i date u formi linearne funkcije objašnjavajućih promenljivih itx , koju je predložio Chamberlain (1984), čime se u model uvodi korelisanost između i i itx . Međutim, primena ovog pristupa na pseudo panelima podrazumeva da se individualne opservacije objašnjavajućih promenljivih zamene grupnim prosecima gtx , tako što se fiksno pridruže datoj grupi (g) kroz vreme, t=1,...,T. Problem sa primenom standardnog pristupa u ocenjivanju modela binarnog 15 Collado (1998) je svoj metod ocenjivanja razvila za skup uporednih podataka za nezavisne uzorke koji se prate tokom određenog vremenskog perioda T (en. time series of independent cross-section data), tako da su jedinice posmatranja različite kroz periode. Ovaj skup podataka se naziva pseudo panelima. Suština je da se, u slučaju odsustva klasičnih serija panel podataka u kojima se iste jedinice posmatranja prate tokom vremena, na osnovu zajedničkih karakteristika obrazuju grupe ili kohorte jedinica posmatranja koje su fiksne kroz T i da se primene odgovarajući metodi occenjivanja (videti npr. Deaton 1985; Verbeek 2008). Analiza razlika u zaradama i višestrukog izbora zaposlenja 32 izbora jeste prisustvo korelisanosti između grešaka i grupnih proseka objašnjavajućih promenljivih. Uvođenjem pretpostavke o normalnoj raspodeli, varijansa grešaka može da se izračuna na bazi individualnih opservacija, čime je omogućeno da se koriguju parametri redukovane forme probit modela. U narednom koraku sledi ocenjivanje strukturnih parametara po metodu minimalne udaljenosti. Za oba metoda ocenjivanja su date asimptotske ocene strukturnih parametara ˆ i asimptotske varijanse ocena. Međutim, Monte Carlo eksperiment je pokazalo da metod ocenjivanja na bazi minimalne udaljenosti između grupa ima manju standardnu grešku regresije nego metod na bazi varijabiliteta unutar grupa, ukazujući na to da se ovim metodom postiže veća asimptotska efikasnost ocena (Collado 1998). 2.2 Modeli za odsečene i cenzurisane podatke panela Šira upotreba modela za odsečene i cenzurisane podatke počinje sa prvom empirijskom primenom modela zavisne promenljive sa ograničenjem u radu Tobin-a (1958), u kojem je korišćen model kojim se na zavisnu promenljivu postavlja takvo ograničenje da ne može uzeti vrednosti manje od nule. Daljom primenom sličnih modela u empirijskom izučavanju ekonomskih fenomena, usled potreba koje su se javljale uporedo sa raspoloživošću mikro podataka, razvijali su se i modeli za odsečene i cenzurisane podatke. Tako su modeli za odsečene podatke primenjivani u slučajevima kada su podaci, usled zadatih ograničenja na vrednosti opservacija zavisne promenljive, trajno izgubljeni, dok su, za razliku od njih, modeli za cenzurisane podatke primenjivani u slučajevima kada je izvan datih ograničenja moguće posmatrati barem opservacije nezavisnih slučajnih promenljivih. Ovi modeli se, dakle, ubrajaju u širu grupu Tobit modela. U ovom poglavlju, najpre će biti definisan model izbora podataka (en. sample selection model) koji takođe predstavlja oblik regresionih modela za odsečene i cenzurisane podatke, a potom će se šire razmatrati izabrani Tobit modeli i metodi ocenjivanja koji se najčešće primenjuju u modeliranju uporednih podataka i podataka panela. Detaljan pregled ovih modela i metoda njihovog ocenjivanja su dali npr. Amemiya (1984) i Vella (1998). Analiza razlika u zaradama i višestrukog izbora zaposlenja 33 2.2.1 Model izbora podataka Polazeći od teorijskih postavki Mincer-a (1962a) o ponudi radne snage u podskupu udatih žena u SAD-u sredinom dvadesetog veka, Mroz (1987) je dao značajan doprinos rasvetljavanju nedostataka i problema koji su se javljali u dotadašnjim empirijskim studijama koje su se bavile testiranjem ove teorije. Njegov doprinos se ogleda u preispitivanju specifikacije ekonometrijskih modela ponude rada kao funkcije časova rada i greške merenja, tretiranju problema pristrasnosti koji je posledica neslučajnog izbora podataka, testiranju egzogenosti objašnjavajućih promenljivih u modelima časova rada, kao i ispitivanju efekta poreza na zarade na ponudu rada žena, što je sve pomoglo realnijem sagledavaju teorijskih implikacija izbora između potrošnje i dokolice. U kasnijim empirijskim studijama, analiza ponude rada je proširena na čitavu populaciju žena u radnom uzrastu, što je bilo rezultat rastućih stopa učešća ženske radne snage na tržištu rada, a obrazovanje je postalo jedna od ključnih promenljivih pri donošenju odluke o uključivanju u ponudu rada, kao i u određivanju visine zarade (Mincer 1962a). 16 Za empirijsku analizu koja je data u doktorskoj disertaciji od ključnog je značaja najpre ukazati na problem pristrasnosti u modelima zarada i ponude rada žena, koji je posledica neslučajnog izbora podataka, a koji su, među prvima, u mikroekonometrijska istraživanja uveli Heckman (1974), Gronau (1974) i Manski (1989).17 Pristrasnost usled neslučajnog izbora podataka u ocenjivanju ekonometrijskih modela se javlja kada neka od determinanti koje objašnjavaju odluku pojedinca da učestvuje na tržištu rada istovremeno utiče i na njegovu zaradu (Vella 1998). Ovaj problem se može rešiti posmatranjem odnosa između jednačine izbora podataka i jednačine zarada samo kroz opažene karakteristike pojedinaca, tako što se u jednačinu zarada uključuje jedna ili više uslovnih promenljivih kojima se obuhvata uticaj opaženih karakteristika. U ovom slučaju, pristrasnost usled neslučajnog izbora podataka ne javlja se samo zbog razlika u opaženim karakteristika pojedinaca. Stoga, ukoliko su neopažene karakteristike 16 Primenu Mincer-ovog pristupa u modeliranju ponude rada žena na početku tranzicionog perioda u Jugoslaviji uradio je Vujčić (1991) na podacima Hrvatske. 17 U domaćoj literaturi, problemi uzrokovani neslučajnim izborom podataka u analizi ponude rada žena razmatrani su u Nojković (2005). Analiza razlika u zaradama i višestrukog izbora zaposlenja 34 pojedinaca te koje utiču na njihovu odluku da učestvuju na tržištu rada i ako su one korelisane sa neopaženim karakteristikama u jednačini zarada, tada ocenjivanje funkcije zarada sa samo opaženim karakteristikama nije dovoljno da bismo dobili nepristrasne ocene parametara ovih dveju jednačina. Štaviše, ako su neopažene karakteristike u jednačini izbora podataka korelisane sa posmatranim karakteristikama u jednačini zarada, izostanak ocene neopaženih karakteristika dovešće do nepreciznih zaključaka o uticaju posmatranih karakteristika na zarade. U ovom slučaju, pristrasnost je rezultat neslučajnog izbora podataka. Iako model izbora podataka ima primenu u brojnim oblastima mikro i makroekonomije, u disertaciji će biti stavljen u kontekst analize koja je predmet istraživanja. Postavku teorijskih modela ponude rada žena, sledeći Mincer-a (1962a) i Heckman-a (1974), moguće je prikazati na sledeći način: ),,,,( 0 * zapyhfy MF  , (2.23a) ),( sefyF  . (2.23b) Jednačina (2.23a) predstavlja “cenu u senci” vremena žena, rezervacionu ili željenu zaradu, kao funkciju časova rada ili vremena koje ženi ostaje raspoloživo za druge aktivnosti izvan tržišta rada (h), zarade muža ( My ), cene dobara (p), dohotka domaćinstva poreklom od kapitala i iz drugih izvora iz kojeg su isključene zarade ( 0a ) i ostalih objašnjavajućih promenljivih (z), kao što su broj dece u domaćinstvu, obrazovanje članova domaćinstva, opremljenost domaćinstva kućnim aparatima i sl., koje mogu da ograniče odluku žena da se uključe u tržište rada. Jednačinom (2.23b) se iskazuje zarada koju zaposlene žene mogu da ostvare na tržištu rada, kao funkcija njenog radnog iskustva (e) i stepena obrazovanja (s). Pošto je, na osnovu (2.23a) i (2.23b), ponuđena (ili tržišna) zarada nezavisna od časova rada, iz ovog sistema jednačina sledi da je neophodan uslov ravnoteže da za nula časova rada ponuđena zarada prevazilazi željenu (ili rezervacionu) zaradu )( 0 *  h FF yy . Na ovom uslovu se zasniva odluka žena da rade i ona služi za dalje razvijanje modela zarada. Analiza razlika u zaradama i višestrukog izbora zaposlenja 35 Budući da zanemarivanje pristrasnosti zbog neslučajnog izbora podataka može da dovede do nekonzistentnih ocena regresionog modela, rešenje se nalazi u kontrolisanju procesa izbora (selekcije) podataka uvođenjem posebne jednačine u model izbora podataka. Model izbora podataka za uporedne podatke glasi: i '*   ii xy , i=1,2,..,N, (2.24a) i '*   ii zd , i=1,2,..,N, (2.24b) 1id ako je 0 * id , (2.24c) = 0 ako je 0* id , * ii yy  ako je 1id , (2.24d) = 0 ako je 0id . Jednačine (2.24a) i (2.24b) se odnose na osnovni regresioni model kojim se, na primer, u ekonomskom modelu ponude rada modeliraju zarade, dok se druga jednačina odnosi na jednačinu izbora (selekcije) podataka kojom se utvrđuje da li dati pojedinac radi ili ne. Jednačine (2.24c) i (2.24d) određuju mehanizam izbora uzorka za iy i id na osnovu pravila datih za *iy i * id . Ovako definisan sistem jednačina omogućava da se problem izbora uzorka, koji je uzrokovao cenzurisanje ili odsecanje podataka, posmatra kroz endogeno određenu jednačinu izbora podataka. Definisanje skupa promenljivih i nepoznatih parametara u gornjem sistemu jednačina je dato kako sledi: *iy je latentna zavisna promenljiva koja se ne opaža, dok je iy zavisna promenljiva koja se opaža, * id je latentna zavisna promenljiva koja je povezana sa funkcijom id , tj. sa promenljivom indikator koja određuje da li se osnovna zavisna promenljiva iy opaža ili ne. Objašnjavajuće promenljive u osnovnom regresionom modelu i jednačini izbora podataka date su u formi vektora ix i iz , dok su  i  pripadajući vektori nepoznatih parametara, respektivno; i i i su slučajne greške modela (2.24a) i (2.24b), za koje se pretpostavlja da su podjednako i nezavisno raspodeljene i da imaju normalnu raspodelu sa parametrima ( 2,0  ), odnosno standardizovanu normalnu raspodelu sa parametrima (0,1), respektivno. Analiza razlika u zaradama i višestrukog izbora zaposlenja 36 Ukoliko se u istraživanjima koriste podaci panel serija, tada je model izbora podataka sledećeg oblika: it '*   tiitit xy , i=1,2,..,N, t=1,...,T, (2.25a) it '*   tiitit zd , i=1,2,..,N, t=1,...,T, (2.25b) 1itd ako je 0 * itd , (2.25c) = 0 ako je 0* itd , * itit yy  ako je 1itd , (2.25d) = 0 ako je 0itd . U sistemu jednačina od (2.25a) do (2.25d), pored oznake za i-tu jedinicu posmatranja, uvodi se oznaka i za vremensku dimenziju posmatranja t. Kao i u modelu za uporedne podatke, ovde se zavisna promenljiva ity posmatra samo za skup opservacija koje zadovoljavaju uslov izbora u uzorak, tj. za koje je indikator promenljiva 1itd ako je 0* itd . Novi članovi u skupu jednačina od (2.25a) do (2.25d) označavaju redom individualne efekte ( i i i ), odnosno vremenske efekte ( t i t ). Sledeći analogiju definisanja modela izbora podataka kojim se u analizu uvodi problem koji nastaje usled neslučajnog izbora uzorka, slučajna greška u jednačinama (2.25a) i (2.25b) može da se obrazuje od sledeće tri komponente: individualnih efekata, vremenskih efekata, kao i od ostatka slučajne greške ( it i it ). Komponente slučajnih grešaka počivaju na pretpostavkama o normalnoj raspodeli, pri čemu se dopušta korelisanost sa komponentama iste dimenzije u drugoj jednačini. Jednostavnost primene odgovarajućih procedura ocenjivanja ovih modela zahteva da se vremenski efekti ( t i t ) umesto kao slučajni tretiraju kao fiksni. Time je omogućeno da se kreirane veštačke promenljive za vreme uključe u skup koji sadrži objašnjavajuće promenljive itx i itz . Metodi ocenjivanja modela izbora podataka za podatke panela će biti razmatrani u narednim tačkama ovog poglavlja. Analiza razlika u zaradama i višestrukog izbora zaposlenja 37 2.2.2 Tobit modeli Klasifikaciju Tobit modela je prikazao Amemiya (1984). Prema ovoj klasifikaciji postoji najmanje pet tipova Tobit modela. Međutim, u empirijskim studijama prva tri modela su našla najveću primenu. U standardnom Tobit modelu (Tobit model I), vrednosti zavisne promenljive iy se opažaju ako je 0 * iy , a ne opažaju se u slučaju da je 0* iy kod odsečenih podataka, odnosno za 0iy kod cenzurisanih podataka. Ovo su klasični modeli zavisne promenljive sa ograničenjem u podacima kojima smo se bavili u prethodnom poglavlju. Model izbora podataka, koji je predstavljen u prethodnoj tački, poznat je i pod nazivom Tobit model tipa dva ili Tobit model II. U nastavku izlaganja u ovoj tački je predstavljen Tobit model III za cenzurisane podatke zavisne promenljive, najpre u slučaju uporednih podataka, a potom i podataka panela.18 Osnovna razlika u odnosu na Tobit model II u kojem je zavisna promenljiva u jednačini izbora podataka binarna promenljiva, jeste da je zavisna promenljiva u obe jednačine (i u osnovnoj regresionoj jednačini i u jednačini izbora (selekcije) podataka) kontinuelna promenljiva. Druga specifičnost ovog modela je i to što se vrednosti zavisne promenljive u jednačini izbora podataka parcijalno posmatraju. Dakle, Tobit model III se može izraziti sledećim skupom jednačina: i '*   ii xy , i=1,2,..,N, (2.26a) i '*   ii zd , i=1,2,..,N, (2.26b) * ii dd  ako je 0 * id , (2.26c) = 0 ako je 0* id , * ii yy  ako je * ii dd  , (2.26d) = 0 ako je 0id , 18 O preostalim specifikacijama Tobit modela videti više u Amemiya (1984, 1985). Vredno je pomenuti da se Tobit model (predstavljen tročlanim sistemom jednačina), koji Lee (1978) koristi u modeliranju zarada za članove i one koji nisu članovi sindikata sa korekcijom za sindikalno članstvo, ubraja u model tipa V prema ovoj klasifikaciji. Analiza razlika u zaradama i višestrukog izbora zaposlenja 38 pri čemu jednačine (2.26c) i (2.26d) određuju mehanizam izbora podataka, što se može objasniti na primeru modela ponude rada na sledeći način. U prethodnom Tobit modelu II, jednačina izbora podataka otkriva da li dati pojedinac radi ili ne, a u Tobit modelu III, od značaja za analizu ponude rada može da bude i to koliko je časova dati pojedinac radio. Budući da je ovaj uslov sličan originalnom Tobin-ovom modelu u kojem su posmatrane samo pozitivne (nenegativne) vrednosti zavisne promenljive, ocenjivanje jednačine izbora za cenzurisane podatke može da se izvrši primenom Tobit analize (Amemiya 1984; Vella 1998). U sistemu jednačina od (2.26a) do (2.26d), id je funkcija koja determiniše izbor podataka u jednačini selekcije, uvodeći graničnu vrednost koja može biti nula ili neki drugi pozitivan broj. Ako je 0* id vrednosti promenljive id su cenzurisane. Dakle, kontinuelna zavisna promenljiva iy se opaža samo za pozitivne vrednosti promenljive id , koja je određena funkcijom * ii dd  , za 0 * id ; suprotno tome, mehanizam izbora podataka sugeriše da su vrednosti zavisne promenljive iy jednake nuli. U ovom slučaju, sistem jednačina od (2.26a) do (2.26d) se naziva Tobit modelom III za cenzurisane podatke (en. censored type 3 Tobit model). Problem cenzurisanja (i odsecanja) podataka zavisne promenljive se u empirijskoj literaturi javlja u nekoliko oblika (Chay i Powell 2001). Prvi problem izbora podataka i metodi koji se koriste u modeliranju tih podataka, odnosi se na cenzurisanje (ili odsecanje) podataka iz nekog poznatog intervala (prvi put su se javili u Tobit modelima sa ograničenjem da se posmatraju samo nenegativne vrednosti zavisne promenljive). Drugi problem cenzurisanja (ili odsecanja) podataka se tiče ograničenja u iskazivanju maksimalne vrednosti podataka zavisne promenljive koji pripadaju desnom kraku raspodele – tzv. desno-cenzurisani podaci, što dovodi do problema cenzurisanja podataka odozgo. Na sličan način, podaci zavisne promenljive mogu da budu i levo-cenzurisani. U empirijskom modeliranju podatka u doktorskoj disertaciji pažnja će biti posvećena prvom problemu izbora podataka zavisne promenljive. Analogno prikazanom Tobit modelu III za uporedne podatke, ovaj model za podatke panela glasi: it '*   tiitit xy , i=1,2,..,N, t=1,...,T, (2.27a) Analiza razlika u zaradama i višestrukog izbora zaposlenja 39 it '*   tiitit zd , i=1,2,..,N, t=1,...,T, (2.27b) * itit dd  ako je 0 * itd , (2.27c) = 0 ako je 0* itd , * itit yy  ako je * itit dd  , (2.27d) = 0 ako je 0itd . Sistem jednačina od (2.27a) do (2.27d) ima sličnu interpretaciju kao i modeli koji su već prethodno izloženi. Dakle, ukoliko ga posmatramo kao statistički model, zavisne promenljive *itd i itd predstavljaju broj željenih i posmatranih časova rada u ekonomskom modelu ponude rada, za razliku od Tobit modela II u kojem je binarna zavisna promenljiva indikator koji ukazuje na to da li određeni pojedinac radi ili ne. Ostale promenljive u modelu, kao i nepoznati parametri imaju istu interpretaciju, a vremenski efekti ( t i t ), na način na koji su prikazani u strukturi modela, mogu da se tretiraju kao fiksni efekti. Razlika između cenzurisanog i odsečenog uzorka se zasniva na tome da li se broj časova rada za pojedince koji nisu zaposleni iskazuje vrednošću zavisne promenljive koja je jednaka nuli ili se posmatraju samo oni pojedinci koji rade, čime se vrednosti zavisne promenljive svode samo na pozitivne časove rada. U ekonomskim modelima ponude rada, individualni efekti i imaju značajnu ulogu, te se veoma često ne može pretpostaviti da su nezavisni od objašnjavajućih promenljivih itx , tako da bi izbor specifikacije Tobit modela III sa fiksnim efektima bio prihvatljiviji od modela sa slučajnim efektima. Model sa slučajnim efektima bi mogao da se oceni ukoliko su zadovoljene stroge pretpostavke na kojima počiva teorijska specifikacija ovog modela (Cameron i Trivedi 2005). Međutim, njegovo ocenjivanje prati komplikovana procedura. S druge strane, parametarski i poluparametarski metodi za ocenjivanje Tobit modela III sa fiksnim efektima su našli značajnu primenu u empirijskim studijama. O ovim modelima će biti više reči u narednim tačkama ovog poglavlja. Analiza razlika u zaradama i višestrukog izbora zaposlenja 40 2.2.3 Parametarski metodi ocenjivanja modela izbora – uporedni podaci Ako se model izbora podataka (2.24a)−(2.24d) primenjuje u modeliraju uporednih podataka, koriste se dve grupe metoda ocenjivanja (Heckman 1974, 1976 i 1979). Prvu čini metod maksimalne verodostojnosti, a zasniva se na sledećim pretpostavkama o slučajnim greškama modela: (i) i i i su nezavisno i identično raspodeljene sa parametrima ( ,0 ), pri čemu je  matrica varijanse ( 2 , 2  =1) i kovarijanse (  ,  ) slučajnih grešaka, i (ii) nezavisne su od vektora objašnjavajućih promenljivih iz u jednačini izbora podataka. Drugu grupu čini dvostepeni metod ocenjivanja sistema jednačina, sa polaznom pretpostavkom da je 0]|[ i ivE  (ne postoji korelisanost između slučajnih grešaka i i i ) ili  =  =0, čime se obezbeđuje konzistentnost ocena dobijenih metodom OLS u osnovnoj regresionoj jednačini (2.24a). Metod ML se zasniva na maksimizaciji sledeće funkcije verodostojnosti, pod uslovom da važe stroge pretpostavke o dvodimenzionalnoj normalnoj raspodeli slučajnih grešaka i i i ; u protivnom, ocene ˆ i ˆ dobijene metodom ML nisu konzistentne:     ii diii d i N i ii dPdyfdPdyl )0()0|()0(),( **1* 1     , i=1,...,N. (2.28) Proizvod funkcije verodostojnosti se sastoji od dva dela. Prvi objašnjava da li promenljiva indikator id uzima vrednost 1 ili 0 na celom uzorku (i=1,...,N) i može se posmatrati kao doprinos latentne promenljive funkciji verodostojnosti, a drugi objašnjava varijacije u zavisnoj promenljivoj iy koja se opaža za poduzorak jedinica posmatranja (i=1,...,N1, N1s). Da bi se ocenila osnovna jednačina u drugom koraku, nužno je ukazati na dva problema: (i) neopaženi efekti za i-tu jedinicu posmatranja više nisu konstantni kroz vreme, pošto je iitit d   i (ii) postoji problem potencijalne endogenosti objašnjavajućih promenljivih 'itx zbog njihove zavisnosti od binarne promenljive itd , što dovodi do pristrasnosti usled “skraćivanja” veličine inicijalnog uzorka. Primenom metoda OLS na model prvih diferenci eliminisali bi se efekti it , ali bi ocene ˆ bile nekonzistentne zbog “skraćenog” uzorka. Ukoliko efekat pristrasnosti usled “skraćivanja” uzorka označimo sa )1,1,,,,,,( ''''  isitiiisitisititit ddxxzzE  , t,s=1,..., iT (t>s); tada, na osnovu linearne transformacije osnovnog modela, koja se sastoji u dodavanju i oduzimanju člana it na desnoj strani jednačine, model sa fiksnim efektima može da se prikaže na sledeći način: it ' uxy itititit   , i=1,2,..,N, t=1,...,T, (2.47) gde je iitit d   , a itu je transformisani član slučajne greške, tj. ititu  it , koji zadovoljava uslov da je 0)1,1,,,,,,( ''''  isitiiisitisitit ddxxzzuE  . Ocenjivanje nepoznatih parametara  se zasniva na činjenici da je oba člana, it i it , moguće eliminisati uvođenjem prvih diferenci, tako da se jednačina (2.47) može napisati (Kyriazidou 1997): )()( it ' isisitisit uuxxyy   , i=1,2,..,N, t,s=1,..., iT (t>s). (2.48) Pod pretpostavkama da su slučajne greške, it i itu , u modelima (2.25a) i (2.47) nezavisne i podjednako raspodeljene i da su nezavisne od objašnjavajućih promenljivih ( 'itx , ' itz ) i individualnih efekata ( i , i ), it se može prikazati: Analiza razlika u zaradama i višestrukog izbora zaposlenja 57 )()()1( '' iitiitititititit zzEdE   , (2.49) gde je   nepoznata funkcija indeksa od )( ' iitz   koja ne varira po t i i. Pošto se prve diference primenjuju na i-tu jedinicu u, na primer, dve vremenske tačke t i s, ovaj metod ima zadovoljavajuća svojstva i pod mnogo blažim pretpostavkama o it i itu . Stoga, nije nužno pretpostaviti da su slučajne greške nezavisne jedna od druge, kao i od objašnjavajućih promenljivih i individualnih (neopaženih) efekata, što implicira da i funkcija   može da varira po i. Dakle, za i-tu jedinicu posmatranja, za koju je  '' isit zz  , važiće i jednakost isit   . Kyriazidou (1997) je pokazala da se ocenjivanje nepoznatih parametara  može sprovesti metodom ponderisanih OLS, korišćenjem pristupa koji je razvio Powell (2001), na “skraćenom” uzorku jedinica posmatranja koje imaju 0ˆ)( '  isit zz i za koje važi da je 1,1  isit dd , za t ≠ s, pod uslovom da su ˆ konzistentne ocene parametara  koje su prethodno dobijene jednim od predloženih metoda ocenjivanja modela binarnog izbora u podacima panela. Ocena nepoznatog parametra  je data kako sledi:             1 ' 1 ˆ)()( 1 1ˆ isit T ts iisitisit N i i ddxxxx T i  (2.50)             isit T ts iisitisit N i i ddyyxx T i ˆ)()( 1 1 ' 1 , i=1,...,N, t,s=1,..., iT (t>s). Svakom paru opservacija iz uzorka veličine N se pridružuje ponder           N isit N i h zz K h   ˆ)(1 ˆ ' , koji teži nuli sa povećanjem apsolutne vrednosti razlike  '' isit zz  , gde je  K funkcija jezgra, a Nh parametar izravnanja (Powell 2001). 28 Takođe, parametar izravnanja Nh teži nuli kako se povećava veličina uzorka N. 28 Jezgro je po definiciji nenegativna simetrična funkcija  K sa integralom jednakim jedinici, tj.   )( aKaK  i   1 daaK . Najčešće korišćene funkcije jezgra su normalna, Epanechnik-ova, Parzen-ova i dr. (videti npr. Greene 2012). Analiza razlika u zaradama i višestrukog izbora zaposlenja 58 Standardne greške ocena parametara se mogu izračunati iz Eicker-White-ove kovarijacione matrice (Kyriazidou 1997): 1 1 1 '2' 1 1 '2 ˆˆˆˆˆˆˆ                     N i N i iiiii N i ii xxuxxxx . (2.51) Reziduali ˆˆˆˆ 'iii xyu  su ocenjeni na bazi regresije (2.48), a     isitisit N isit i ddyy h zz Ky ' ' ˆ ˆ     , dok je     isitisit N isit i ddxx h zz Kx ' ' ˆ ˆ     . Izloženi metod ocenjivanja daje konzistentne i asimptotski normalno raspodeljene ocene sa stopom konvergencije NNh (Kyriazidou 1997). 2.2.5.2 Metodi ocenjivanja modela izbora podataka sa slučajnim efektima Polazeći od postojećih metoda ocenjivanja modela izbora podataka za uporedne podatake (Heckman 1976, 1979) i za podatke panela, razvijena je dvostepena procedura (Vella i Verbeek 1999), koja se temelji na tome da su endogenost latentne zavisne promenljive i pristrasnost usled neslučajnog izbora podataka rezultat zanemarivanja heterogenosti ili varijabilnosti po jedinicama posmatranja u osnovnoj jednačini. Prema toj proceduri, reziduali iz ocenjene redukovane forme modela se uključuju kao dodatne objašnjavajuće promenljive u osnovnu jednačinu kako bi se ta heterogenost obuhvatila. Ovaj metod se, za razliku od dva prethodno izložena metoda (Wooldridge 1995; Kyriazidou 1997), primenjuje u modelima sa slučajnim efektima. Slično pristupu koji je razvila Kyriazidou (1997), ovde se problem endogenosti, odnosno pristranosti usled neslučajnog izbora jedinica posmatranja analizira kroz uključivanje promenljive koja izražava vremenske efekte. Za razliku od klasičnog pristupa koji problem pristrasnosti usled neslučajnog izbora jedinica posmatranja rešava primenom fiksne specifikacije (i na taj način eliminisanjem svih oblika neopažene heterogenosti), ovim metodima ne mogu da se eliminišu i svi izvori pristrasnosti (Vella 1998). Analiza razlika u zaradama i višestrukog izbora zaposlenja 59 Model izbora podataka sa slučajnim efektima zahteva nešto širu specifikaciju u odnosu na onu prikazanu u obliku standardnog Tobit modela za cenzurisane podatake (2.27a)−(2.27d):29 it '*   iitit xy , i=1,2,..,N, t=1,...,T, (2.52a) it ' 1 '*    iititit dzd , i=1,2,..,N, t=1,...,T, (2.52b) * itit dd  ako je 0 * itd , (2.52c) = 0 ako je 0* itd , * itit yy  ako je * itit dd  , (2.52d) = 0 ako je 0itd . Izrazom (2.52a) je definisana osnovna jednačina, dok (2.52b) predstavlja redukovanu formu modela. Mehanizam izbora podataka je definisan pravilima datim u (2.52c) i (2.52d). Pri tome, podrazumeva se da je data neka funkcija )(g , kojom se, na osnovu uslova da je )( itit dgd  , determiniše izbor podataka, odnosno koje vrednosti od ity će biti posmatrane, tako da je *itit yy  . Jednačina izbora podataka ili redukova forma modela (2.52b) uključuje dodatni član ' 1itd i nepoznati parametar  , a svi ostali članovi modela imaju isto značenje kao što je već objašnjeno u tački 2.2.2. Uključivanjem latentne zavisne promenljive sa docnjom u jednačinu izbora podataka omogućava se da se problem selekcije opservacija u modelu posmatra na način da se izoluje uticaj individualnih efekata od potencijalne zavisnosti od njihovog izbora u prethodnom periodu (en. state dependence). Model sa slučajnim efektima (2.52a)−(2.52d), počiva na nekoliko pretpostavki o slučajnim greškama it  iitu i it  iitv : individualni efekti i i i , kao i 29 Analogno ovom prikazu modela, model izbora podataka sa slučajnim efektima se dobija ukoliko se u (2.52c) uvede uslov da je 1itd kojim se vrši cenzurisanje opservacija u datom skupu podataka. To implicira da se opservacije zavisne promenljive ity posmatraju, odosno da je * itit yy  , na bazi čega se vrši izbor opservacija od ity u (2.52d), a u protivnom 0ity . Analiza razlika u zaradama i višestrukog izbora zaposlenja 60 ostatak slučajne greške it i it , su nezavisni za svako i i j, pri čemu je i ≠ j. Uslovna raspodela slučajne greške modela glasi (Vella i Verbeek 1999): ii xv ~IID )',0( 22 TI   i (2.53a) iitiiit vvvxuE 21),(   , (2.53b) gde je iv vektor dimenzije T za svako i [ ' 1 ),...,( iTii vvv  ], a ' 1 ),...,( iTii xxx  ,  predstavlja jedinični vektor dimenzije T, T je jedinična matrica reda T,    T t iti v T v 1 1 , dok su 1 i 2 nepoznati parametri koji se ocenjuju uključivanjem u jednačinu (2.52a). Uslovom (2.53a) se uvodi pretpostavka o normalnoj raspodeli slučajne greške u jednačini (2.52b), kao i stroge pretpostavke o varijansi komponenti slučajne greške ( i i it ) i o odsustvu autokorelacije u ostatku slučajne greške. Uslovna očekivana vrednost od itu , data izrazom (2.53b), ostavlja mogućnost za heteroskedastičnost i autokorelaciju u ostatku slučajne greške u osnovnoj jednačini (2.52a), ali se zasniva na pretpostavci o strogoj egzogenosti skupa objašnjavajućih promenljivih. Prvi korak u ocenjivanju modela (2.52a)−(2.52d), sastoji se u izračunavanju uslovne očekivane vrednosti od it u (2.52b), odnosno (Vella i Verbeek 1999):      iiiiiiiiiitiiiiit dddzfddzEddzvE  ,,|,,,|),,|( 000   , (2.54) gde je '1 ),...,( iTii zzz  , 0id je vrednost od id u nekom inicijalnom periodu t=0, koji prethodi uzoračkom periodu,  iiii ddzf ,,| 0 je uslovna funkcija gustine od i , a  iiiiit ddzE  ,,,| 0 je uopšteni rezidual (en. generalized residual) iz jednačine (2.52b), 30 odnosno iz probit modela sa slučajnim efektima ukoliko je sistem jednačina (2.52a)– (2.52d) dat u fomi modela izbora podataka. Ocenjivanje funkcije verodostojnosti 30 Suština korišćenja izraza generalizovani rezidual leži u činjenici da reziduali itˆ ocenjeni iz jednačine (2.52b) zavise od latentne promenljive koja se ne može opaziti, tako da se slučajna greška zamenjuje svojom očekivanom vrednošću (Gourieroux et al. 1987). Analiza razlika u zaradama i višestrukog izbora zaposlenja 61 metodom ML je komplikovano (videti tačku 2.1.2.2), ukoliko se ne pretpostavi da je uslovna očekivana vrednost od it uslovljena i sa i , čime se osigurava da su slučajne greške itv u (2.52b) nezavisne kroz jedinice posmatranja. Funkcija uslovne raspodele od i , pod pretpostavkom da je i nezavisno od iz , može da se prikaže u obliku:   )|,( )(),|,( ,,| 0 0 0 iii iiiii iiii zddf fzddf ddzf    , (2.55) gde su redom iiiiiiiii dfzddfzddf  )(),|,()|,( 00  doprinos i-te opservacije funkciji verodostojnosti u (2.52a), )()|( iii fzf   je funkcija gustine normalne slučajne promenljive, a    T t iiiiitiitiiii zdfdzdfzddf 1 010 ),|()],,|([),|,(  , pri čemu je ),,|( 1 iitiit dzdf  doprinos funkciji verodostojnosti svih opservacija u uzorku. Ocenjivanje metodom ML se zasniva na pretpostavci da je 0id strogo egzogeno, tj. )|(),|( 00 iiiii zdfzdf  , kao i da je nezavisno od ostatka slučajne greške. Heckman (1981) je predložio da se redukovana forma od 0id oceni primenom probit modela sa slučajnim efektima, tako što bi se u skup objašnjavajućih promenljivih uvrstile sve raspoložive promenljive koje čine informacionu bazu iz preduzoračkog perioda. Ocenjivanje osnovne jednačine (2.52a) se, zatim, u drugom koraku, sprovodi metodom OLS. Konzistentne ocene nepoznatih parametara  su:                    N i it T t itit N i it T t itit yxdxxd 1 1 ' 1 1 1 'ˆ , i=1,...,N, t=1,...,T. (2.56) U model (2.52a) se uključuju i dva dodatna člana itv i iv sa nepoznatim parametrima 1 i 2 , čije ocene )ˆ,ˆ( iit vv se dobijaju iz redukovane forme modela (2.52b). Ocenjeni Analiza razlika u zaradama i višestrukog izbora zaposlenja 62 parametri 1ˆ i 2ˆ se koriste da bi se formirala standardna Wald-ova statistika testa. 31 Pod nultom hipotezom 0: 210 H , ovaj test služi za ispitivanje pretpostavke o odsustvu endogenosti ili pretpostavke kojom se tvrdi da ne postoji pristrasnost u modelu koja je rezultat neslučajnog izbora jedinica posmatranja. Ako se 0H ne odbaci, metod OLS daje precizne standardne greške ocena parametara. U suprotnom, izračunate standardne greške moraju da se koriguju za prisustvo heteroskedastičnosti i autokorelacije, kao i za ocenjivanje dva dodatna člana modela (Vella i Verbeek 1999). Ukoliko je u osnovnoj jednačini endogenost prisutna samo kroz statističku znаčajnost člana ivˆ , nije potrebno da se iz skupa objašnjavajućih promenljivih ' itx u (2.52a) isključi najmanje jedna promenljiva da bi bio zadovoljen uslov o identifikovanosti parametara modela. 2.3 Kvantilne regresije u podacima panela Kvantilna regresija omogućava da se uslovna raspodela zavisne promenljive posmatra, tj. modelira kroz kvantile ili percentile raspodele, gde je kvantil (odnosno percentil) proizvoljno određena proporcija opservacija te raspodele. Teorijsku postavku za kasniju primenu kvantilnih regresija su dali Koenker i Bassett (1978). Primena kvantilnih regresija u ekonometrijskom modeliranju je motivisana činjenicom da se efekti objašnjavajućih promenljivih ocenjuju ne samo u srednjoj vrednosti, što omogućuju klasični regresioni metodi ocenjivanja, već i na ostalim delovima raspodele zavisne promenljive. 32 Modeliranje mikroekonomskih podataka kvantilnim regresijama omogućava da se sačuvaju informacije, koje bi usled “agregiranja” podataka na bazi modeliranja klasičnim linearnim regresionim modelima bile izgubljene, a koje mogu da ilustruju kako objašnjavajuće promenljive utiču na različite frakcije raspodele zavisne promenljive. 31 U modelu izbora podataka, ocenjivanje osnovne jednačine na (cenzurisanom) poduzorku opservacija, kada je dit=1, omogućava primenu t-testa za ispitivanje pristrasnosti, time što se testira statistička značajnost svakog od dodatnih članova u modelu ponaosob. 32 Poređenje klasičnog linearnog regresionog modela i kvantilnih regresija možda najbolje opisuju Bassett et al. (2002) kada kažu da klasični linearni regresioni model prezentuje “sumu” svih efekata koje daju kvantili. Analiza razlika u zaradama i višestrukog izbora zaposlenja 63 Prve primene kvantilnih regresija se vezuju za empirijske studije Buchinsky-og (1994), Chamberlain-a (1994) i Poterba-e i Rueben-a (1994) u kojima su analizirani efekti komponenata ljudskog kapitala, članstva u sindikatima, sektora zaposlenja, javnog i privatnog, i drugih objašnjavajućih promenljivih duž cele raspodele zarada. Kvantilne regresije su korišćene i u analiziranju nejednakosti u zaradama (Gonzáles i Miles 2001; Machado i Mata 2001), stopa prinosa na obrazovanje u strukturi zarada žena u SAD-u uz kontrolisanje pristranosti usled neslučajnog izbora podataka (Buchinsky 2001), kao i u analiziranju individualne heterogenosti, posmatrane kroz efekte stopa prinosa na obrazovanje na različitim delovima raspodele zarada članova iste porodice (braće i sestara), uz kontrolisanje potencijalne endogenosti obrazovanja (Arias et al. 2001). 33 U analizi jaza u zaradama muškaraca i žena, sa kontrolisanjem pristranosti usled neslučajnog izbora podataka, kvantilne regresije su koristili, na primer, García et al. (2001) i Nicodemo (2008) u svojim studijama za zemlje EU, a Bargain i Melly (2007) su proširili kvantiline regresije metodima ocenjivanja fiksnih efekata za podatke panela, analizirajući sektorski jaz u zaradama za muškarce i žene zaposlene u javnom i privatnom sektoru u Francuskoj. Bez obzira na činjenicu da se prvi teorijski radovi o kvantilnim regresijama vezuju za Koenker-a i Bassett-a (1978, 1982), metode ocenjivanja za kvantilne regresije sa primenom na uzorcima podataka panela još uvek prate brojni metodološki izazovi (Koenker 2004), čije rešenje bi doprinelo njihovoj široj popularizaciji u empirijskim istraživanjima. 2.3.1 Specifikacija modela Kvantilna regresija, čijom primenom su Koenker i Bassett (1978, 1982) i Koenker (2005) omogućili da se na bazi ocenjivanja uzoračkih kvantila mere efekti promena objašnjavajućih promenljivih na različitim delovima uslovne raspodele zavisne promenljive, poslužila je kao osnov za razvijanje brojnih metoda ocenjivanja. Ovi metodi omogućuju da se lokacija merenja efekata objašnjavajućih promenljivih pomeri 33 Takođe, kvantilne regresije su primenljivane i u analizi efekata izbora programa obrazovanja u SAD-u radi donošenja zaključaka vezano za ocenu efektivnosti politika u oblasti obrazovanja (videti npr. Bassett et al. 2002; Lamarche 2008). Analiza razlika u zaradama i višestrukog izbora zaposlenja 64 iz srednje vrednosti ka drugim (ne)centralnim lokacijama uslovne raspodele zavisne promenljive. Jedan od takvih metoda jeste i metod najmanjih apsolutnih odstupanja koji je izložen u tački 2.2.4.2, a koji je Powell (1984) definisao za ocenjivanje regresionog modela u medijani, kao specijalnog oblika kvantilne regresije. Kasnije je Powell (1986b) svoj teorijski pristup baziran na primeni kvantilnih regresija proširio na Tobit modele sa cenzurisanim podacima zavisne promenljive. Metodi kvantilne regresije Koenker-a i Bassett-a (1978, 1982) prvobitno su razvijeni samo za uporedne podatke. Za podatke panela je razvijen sledeći model kvantilne regresije sa fiksnim efektima (en. quantile regression with fixed effects) (Koenker 2004): )()()( ' jitjitiitjy xxQ it   , j=1,...,q, i=1,...,N, t=1,...,T. (2.57) U modelu (2.57), zavisna promenljiva ity je izražena u formi percentilne raspodele Q koja zavisi od skupa objašnjavajućih promenljivih itx , tj. )( itjyit xQy it  , gde je j frakcija raspodele od ity određena veličinom j-tog kvantila, takva da je  1,0j , 34 a broj kvantila određen je sa q. Efekti objašnjavajućih promenljivih itx koji se izražavaju skupom nepoznatih parametara  zavise od j , dok individualni efekti i ne zavise od j . 2.3.2 Metodi ocenjivanja Da bi se ocenio model (2.57) koji se sastoji od j kvantila, Koenker (2004) je predložio metod minimizacije penalizovane verzije funkcije gubitka kvantilne regresije (en. penalized version of quantile loss function) koji se bazira na linearnom programiranju i 34 U empirijskim studijama, j se određuje tako da označava jednako udaljene kvantile uslovne raspodele zavisne promenljive. Na primer, ako je j=0,50, time se određuje medijana ili 0,50-ti kvantil raspodele koji obuhvata 50% opservacija date promenljive koje se nalaze ispod 0,50-tog kvantila raspodele. j obično uzima sledeće vrednosti, j=0,10; 0,25; 0,50; 0,75; 0,90. U opštem slučaju, širina između kvantila određuje se na bazi obrasca 100(1-2p)%, gde je p proizvoljna proporcija raspodele (Hao i Naiman 2007). Analiza razlika u zaradama i višestrukog izbora zaposlenja 65 koji se sastoji u rešavanju problema minimuma uopštene mere distance koju reprezentuje vektor reziduala. Ocenjeni vektori parametara ˆ za regresioni kvantil j i individualnih efekata iˆ rezultat su rešenja linearnog programa:           q j N i T t jitiitjij xyj 1 1 1 ' , minˆ,ˆ    ,  1,0j , (2.58) gde su j ponderi koji služe za kontrolisanje relativnog uticaja j-tog kvantila na ocenjivanje parametara i .    )0(  uIuu jj  je funkcija gubitka (en. loss function) linearnog kvantila  qj  ,...,1 , a )(I je funkcija indikator koja ukazuje na negativni deo vektora reziduala (Koenker 2005). Jedan od izazova u pronalaženju rešenja za (2.58) jeste izbor podnera j za pridružene regresione kvantile j . Koenker (2004) je predložio izbor tri pondera, j = (0,25; 0,50; 0,25), na bazi Tukey-evog kriterijuma. Problem ocenjivanja parametara i i u slučaju kvantilinih regresija vezuje se za dimenzije panela, tj. za relativno veliki broj jedinica posmatranja i fiksan vremenski period. Ako se pretpostavi da skup objašnjavajućih promenljivih itx kao svoj prvi element sadrži slobodni član, ocenjivanje nepoznatih parametara modela (2.57) zahteva drugačiji pristup problemu linearnog programiranja. Tada zajednička srednja vrednost predstavlja centralnu tendenciju odgovora na regresionom kvantilu uslovne raspodele zavisne promenljive determinisanu centriranjem vrednosti drugih objašnjavajućih promenljivih. Koenker (2004, 2005) predlaže da se kvantilna regresija oceni metodom koji minimizira funkciju cilja (2.58) sa ponderima ( j ) koji se pridružuju odgovarajućim kvantilima:            N i i q j N i T t jitiitjij xyj 11 1 1 ' , minˆ,ˆ    ,  1,0j . (2.59) Analiza razlika u zaradama i višestrukog izbora zaposlenja 66 Uključivanje poslednjeg aditivnog člana u (2.59) sa parametrom penalizacije  proizvodi dva rešenja: 1) kada 0 , ocenjivanje se svodi na kvantilnu regresiju sa fiksnim efektima koju smo prikazali u (2.58); 2) kada  , to implicira da i 0ˆ i , i , tako da su iz modela kvantilne regresije isključeni fiksni efekti. Međutim, budući da je  '' ,1 itit xx  , i=1,...,N, t=1,...,T, rešenje problema (2.59) u oba slučaja daje za rezultat q ocena slobodnih članova za svaki regresioni kvantil j . 35 Na osnovu rezultata Koenker-a (2004) i Chernozhukov-a i Hansen-a (2008), razvijen je dvostepeni metod ocenjivanja kvantilnih regresija za podatke panela (en. two-step estimator for panel data quantile regression) (Canay 2011). Metod se zasniva na takvoj transformaciji podataka panela kojom se eliminišu fiksni efekti i . Dvostepena procedura ocenjivanja kvantilne regresije se sastoji iz sledeća dva koraka. U prvom koraku se modelira uslovna srednja vrednost od ity , a na osnovu ocene nepoznatog parametra  , koja je dobijena standardnim kovarijacionim metodom u modelu sa fiksnim efektima (videti tačku 2.1.1.2), izračunava se iˆ kao što sledi:  ˆˆ 'ititi xy  , (2.60) gde je ˆ NT – konzistentna ocena od  , a  '' ,1 itit xx  , i=1,...,N, t=1,...,T. U drugom koraku, definiše se iitit yy ˆˆ  , tj. ocenjeni individualni efekti se koriste da bi se korigovale vrednosti zavisne promenljive ity . Nakon toga, ocenjivanje nepoznatih parametara  j se bazira na kvantilnoj regresiji koja ne sadrži i :           q j N i T t jititj xyj 1 1 1 'ˆminˆ    ,  1,0j . (2.61) 35 Jednu od prvih primena ovog metoda, uradio je Lamarche (2008), primenjujući kvantilne regresije u evaluaciji uticaja izbora programa obrazovanja na akademska dostignuća učenika u SAD-u za period od četiri godine. Takođe, u radu je korišćen metod samouzorkovanja (en. bootstrap method) da bi se poboljšala preciznost ocena kvantilne regresije, kao i instrumentalne promenljive da bi se ocenili efekti programa. O metodu samouzorkovanja videti više npr. u Efron i Tibshirani (1993). Analiza razlika u zaradama i višestrukog izbora zaposlenja 67 U ocenjivanju (2.61) primenjuju se standardni metodi za kvantilne regresije (Koenker i Bassett 1978, 1982). U slučaju kada N i T izloženi metod ocenjivanja kvantilne regresije za podatke panela daje asimptotski normalno raspodeljene ocene nepoznatih parametara  j (Canay 2011). Analiza razlika u zaradama i višestrukog izbora zaposlenja 68 3. TESTOVI I POSLEDICE POGREŠNE SPECIFIKACIJE U MODELIMA PANELA Korišćenje mikro podataka ili podataka prikupljenih putem anketa često rezultuje heteroskedastičnošću u ocenjenim regresionim modelima (Deaton 2000). Poznato je da narušenost pretpostavke o homoskedastičnosti slučajne greške zadržava svojstvo konzistentnosti ocena regresionih parametara, ali da vodi ka neefikasnim ocenama i pristrasnim standardnim greškama, čime zaključivanje na bazi statističkih testova postaje nepouzdano (Baltagi 2013). Slični problemi o zaključivanju na bazi ocena regresionih modela nastaju takođe i kada postoji autokorelacija slučajne greške, mada je ovaj problem manje izražen u mikro podacima panela ako je vremenska dimenzija posmatranja kratka (Wooldridge 2006). Nadalje, osim što pretpostavka o nekorelisanosti individualnih efekata i objašnjavajućih promenljivih može da bude restriktivna u empirijskom modeliranju mikro podataka panel serija, primena određenih metoda ocenjivanja zahteva da je ispunjena i pretpostavka da su individualni efekti nezavisno i podjednako raspodeljeni. Problem izbora jedinica posmatranja u uzorak (en. sample selection) takođe je često prisutan u empirijskim istraživanjima, i to kako u istraživanjima zasnovanim na uporednim podacima tako i na podacima panela. Ovaj problem se povezuje sa odlukom koju donosi dati pojedinac kada se pridružuje određenoj grupi (en. self-selection) i prisutan je u studijama o ponudi rada, kao i sa odlukom analitičara koji određuje da li će dati pojedinac biti izabran u određenu grupu ili ne, što je često prisutno u procenama efekata aktivnih mera na rezultate koje korisnici postižu na tržištu rada i sl. istraživanjima. Problemi izbora uzorka i pristrasnosti koju generiše neslučajan izbor jedinica posmatranja, često su razmatrani u ekonometrijskoj literaturi (videti npr. Heckman 1974, 1976, 1979; Gronau 1974; Maddala 1983; Manski 1989; Kyriazidou 1997; Vella 1998 i dr.). U nastavku ovog poglavlja će biti izloženi neki od testova heteroskedastičnosti, autokorelacije, odsustva normalnosti, kao i Hausman-ov test specifikacije u modelima panela (Hausman 1978). U poslednjoj tački ovog poglavlja će biti predstavljeni izabrani testovi za ispitivanje pristrasnosti koja se javlja usled neslučajnog izbora jedinica posmatranja u panelu. Analiza razlika u zaradama i višestrukog izbora zaposlenja 69 3.1 Testovi heteroskedastičnosti, autokorelacije i odsustva normalnosti 3.1.1 Heteroskedastičnost U klasičnoj ekonometrijskoj literaturi se navodi da su preduslovi za odsustvo heteroskedastičnosti tačna funkcionalna forma statističkog modela i obuhvat svih objašnjavajućih promenljivih, što je često veoma teško ostvariti u realnim uslovima (Baltagi 2013). Heteroskedastičnost se može javiti u uslovima izostavljanja promenljive iz modela, što čini slučajnu grešku pogrešno specifikovanom i uzrokuje njeno heteroskedastično ponašanje, ali i u uslovima tačne specifikacije ekonometrijskog modela, kada slučajna greška nije konstantna već se menja kroz jedinice i periode posmatranja, čemu uzrok mogu da budu greške u merenju i slični problemi. Postupak testiranja heteroskedastičnosti u komponentama slučajne greške modela panela se formalno bazira na testiraju nule hipoteze H0: )( iVar  = 2  i/ili H0: )( itVar  = 2  , nasuprot alternativnoj H1: )( iVar  = 2 i  i/ili H1: )( itVar  = 2 it  . Primena različitih testova podrazumeva istovremeno testiranje heteroskedastičnosti u obe komponente ili u svakoj od njih posebno. Definisano je nekoliko procedura testiranja koje su zasnovane na Breusch-Pagan-ovom LM testu (Breusch i Pagan 1979) modifikovanom za podatke panela. Ova grupa testova pomaže u otkrivanju koje objašnjavajuće promenljive uzrokuju heteroskedastičnost u modelu i osetljiva je ukoliko je narušena pretpostavka o normalnosti slučajne greške (Verbeek 2002). Jedan od tih testova se koristi u ispitivanju heteroskedastičnosti slučajne greške u modelu sa fiksnim efektima. Procedura testiranja se sastoji u ocenjivanju regresije kvadrata reziduala na konstantu i skup objašnjavajućih promenljivih itz za koje se pretpostavlja da uzrokuju heteroskedastičnost, pri čemu je itit xz  . Pod H0 statistika testa se izračunava kao N(T- 1) 2R i ima asimptotsku 2 raspodelu sa (K-1) stepeni slobode, gde je K broj objašnjavajućih promenljivih. U modelu sa slučajnim efektima, sličan LM test se primenjuje za ispitivanje homoskedastičnosti ostatka slučajne greške tako što se obrazuje nova promenljiva iz odnosa sume kvadrata reziduala i njihove varijanse ( 22 /  it ), koja se zatim regresuje na objašnjavajuće promenljive koje su potencijalni Analiza razlika u zaradama i višestrukog izbora zaposlenja 70 uzrok heteroskedastičnosti. Statistika testa je jednaka polovini objašnjene sume kvadrata iz ove regresije i ima asimptotsku 2 raspodelu sa (K-1) stepeni slobode. Sličan test, koji se bazira na Rao-ovom testu pogodaka, razvili su Holly i Gardiol (2000), polazeći od modela sa slučajnim efektima (koji počiva na strogoj pretpostavci o homoskedastičnosti individualnih efekata) i njegovog ocenjivanja metodom ML. Statistika testa pripada familiji LM testova i jednaka je polovini objašnjene sume kvadrata iz regresije OLS kojom se ) ˆ ( N i I s s  regresuje na sve objašnjavajuće promenljive originalnog modela, bez uključene konstante. Sledi da su isˆ individualni proseci reziduala ( ituˆ ) dobijenih primenom metoda ML na model sa ograničenjem pod H0 da su komponente slučajne greške homoskedastične, dok je s prosek od isˆ . Test se bazira na pretpostavci da su komponente slučajne greške normalno raspodeljene. U kontekstu primene probit analize, vredno je pomenuti LM test heteroskedastičnosti ostatka slučajne greške koji se zasniva na uopštenom rezidualu ( itˆ ) ocenjenog probit modela (Gourieroux et al. 1987). 36 Formira se pomoćna regresija vektora jedinica na 'ˆ ititx i '' )ˆˆ( ititit zx  , gde je itit xz  . Zatim se izračuna statistika testa LM kao umnožak (NT) 2R . Pod H0 ova statistika testa ima 2 raspodelu sa K stepeni slobode, gde je K broj promenljivih iz podskupa ( 'itz ), bez uključene konstante. Slična statistika testa LM primenjuje se i u Tobit analizi. U grupu LM testova se ubraja i varijanta White-ovog testa (White 1980) heteroskedastičnosti ostatka slučajne greške u modelima iz kojih su eliminisani individualni efekti. Obrazuje se serija kvadrata reziduala koja se regresuje na sve objašnjavajuće promenljive iz originalnog modela, njihove kvadrate i međuproizvode. Statistika testa je jednaka (NT) 2R i ima asimptotsku 2 raspodelu sa brojem stepeni 36 U modelu binarnog izbora, rezidual ne može da se odredi iz iy i  ' ix , te se zamenjuje uslovnom očekivanom vrednošću, implicirajući da se sve što je poznato o latentoj zavisnoj promenljivoj * iy bazira na iy . Drugim rećima, rezidual se zamenjuje svojom najboljom predikcijom (Gourieroux et al. 1987). U probit modelu, tˆ će biti jednako )(/)( ''  ii xFxf za iy =1, odnosno  )(1/)( ''  ii xFxf  za iy =0. Analiza razlika u zaradama i višestrukog izbora zaposlenja 71 slobode jednakim broju regresora, bez slobodnog člana. Ovaj uopšteni test se najčešće koristi za ispitivanje heteroskedastičnosti nepoznate forme, te nije potrebno unapred znati koje objašnjavajuće promenljive uzrokuju heteroskedastičnost, kao ni da li je zadovoljen uslov o normalnoj raspodeli slučajne greške. 3.1.2 Autokorelacija U klasičnim modelima panela polazi se od pretpostavke da jedina korelisanost postoji između istih jedinica posmatranja i da je ona postojana tokom vremena, tj. njen uticaj ne slabi sa odmicanjem na vremenskoj osi panela, dok se za ostatak slučajne greške pretpostavlja da ima konstantnu varijansu koja je jednaka nula (Baltagi 2013). Prisustvo autokorelacije čini da ocene regresionih parametara ostaju konzistentne, ali neefikasne (njihove standardne greške su pristrasne), što vodi nepreciznom zaključivanju. Budući da ostatak slučajne greške u modelima panela obuhvata i uticaj izostavljenih regresora, prisustvo autokorelacije u modelu ukazuje na pogrešnu specifikaciju. Baltagi (2013) je izložio tri procedure testiranja serijske korelisanosti grešaka prvog reda i prisustva individualnih efekata u modelima panela koje se baziraju na testovima LM koje su razvili Baltagi i Li – BL.37 Međutim, za analizu mikro podataka panel serija, za koje je karakteristično prisustvo individualnih efekata, od posebnog je značaja združeni LM test (en. joint LM test) kada se istovremeno testira prisustvo autokorelacije ostatka slučajne greške koja sledi AR(1) proces i individualnih slučajnih efekata. Testira se nulta hipoteza H0: 0 2  i 0 , naspram alternativnoj H1: 0 2  i  i 0 (ili 0 ), u klasičnom modelu panela gde se greška razlaže na dve komponente: it  iitu . Podsetimo se da u klasičnom modelu panela važe pretpostavke da je i ~ ),0( 2 N , dok je it proces belog šuma, itit   1it sa 1 i it ~ ),0( 2 N . 38 Statistika testa se definiše na sledeći način: 37 Ove procedure su detaljnije izložene u Baltagi (2013). 38 Baltagi (2013) je pokazao da statistika testa BL ne zavisi od forme serijske korelisanosti, tj. test ostaje isti i u uslovima kada ostatak slučajne greške sledi MA(1) proces. Takođe, primena ovih testova je prilagođena AR(.) i MA(.) procesima višeg reda. Analiza razlika u zaradama i višestrukog izbora zaposlenja 72  22 2 24 )2)(1(2 TBABA TT NT BL    , (3.1) gde je 1]ˆˆ/ˆ)(ˆ[ ''  uuuJIuA TN , ]ˆˆ/ˆˆ[ ' 1 ' uuuuB  , NI i TJ su jedinične matrice reda N i T, uˆ su reziduali modela ocenjenog metodom OLS, pri čemu 1ˆu predstavlja seriju reziduala sa docnjom od jednog perioda. Pod H0 statistika testa (3.1) ima asimptotsku 2 sa 2 stepena slobode kada samo N . Nadalje, test autokorelacije u modelu sa fiksnim efektima su razvili Bhargava, Franzini i Narendranathan – BFN (1982), polazeći od standardnog Durbin-Watson-ovog (1950) testa autokorelacije. Testira se nulta hipoteza H0: 0 protiv jednostrane alternativne H1: 0 (ili 0 ). Slično kao i kod prethodnog testa it , itit   1it , sledi AR(1) proces, a it ~ ),0( 2 N . Statistika testa je sledeća:         N i T T it N i T t itit BFN 1 1 2 1 2 2 1 ˆ )ˆˆ(   , (3.2) gde su iititit xy  ˆ ˆˆ '  reziduali ocenjeni metodom unutar jedinica posmatranja ili metodom OLS sa veštačkim promenljivim za individualne efekte. U panelima sa velikim brojem jedinica posmatranja N, dovoljno je da se pri testiranju postojanja pozitivne autokorelacije ( 0 ) uporedi da li je izračunata vrednost BFN statistike testa manja od 2. Kritične vrednosti BFN testa zavise od dimenzije K, N ili T i nisu raspoložive za nebalansirane panele. Ovaj test je moguće primeniti i za testiranje autokorelacije ostatka slučajne greške u modelu sa slučajnim efektima (Verbeek 2002). Wooldridge (2006) je sugerisao primenu dva testa za testiranje autokorelacije slučajne greške koji se baziraju na primeni t-testa u modelu sa fiksnim efektima. U prvom testu, koriste se reziduali ocenjenog modela fiksnih efekata primenom metoda unutar jedinica posmatranja, da bi se pod nultom hipotezom ispitalo da li postoji serijska korelisanost Analiza razlika u zaradama i višestrukog izbora zaposlenja 73 slučajne greške. Ovaj test se može koristiti samo preliminarno da bi se ukazalo na problem autokorelacije. U drugom testu se koriste reziduali dobijeni ocenjivanjem modela sa fiksnim efektima u prvim diferencama. Prva diferenca reziduala itˆ , dobijena kao  ˆˆ 'ititit xy  , zatim se regresuje na prvu diferencu reziduala sa docnjom 1ˆ  it i na bazi ocenjenog koeficijenta ˆ testira se nulta hipoteza H0: 0 . Ukoliko je zadovoljen uslov da it ima konstantnu varijansu, Wooldridge (2006) je pokazao da odsustvo autokorelacije implicira da je 5,0),( 1  ititCorr  . Drukker (2003) je unapredio primenu t-testa time što je sugerisao da se u formiranju izračunate vrednosti testa koriste robustne standardne greške u prisustvu heteroskedastičnosti i autokorelacije. 3.1.3 Odsustvo normalnosti Bazirajući se na činjenici da normalna raspodela slučajne promenljive podrazumeva da su treći (asimetrija) i četvrti (spljoštenost) uslovni momenat jednaki respektivno nula i tri, testiranje nulte hipoteze o normalnosti u linearnim regresionim modelima se zasniva na tvrdnji kojim se ispituje odstupanje slučajnih grešaka od očekivanih vrednosti. Testovi normalnosti u linearnim modelima panela predstavljaju generalizaciju testova koji su razvijeni za regresione modele uporednih podataka. Jedan od tih testova je i klasični White-ov test informacione matrice kojim se zajedno testiraju homoskedastičnost i normalnost.39 Zbog problema koji nastaju sa cenzurisanjem i odsecanjem podataka, klasični testovi koji su razvijeni za ispitivanje normalnosti u linearnim regresionim modelima ne mogu da se primene i u modelima zavisne promenljive sa ograničenjem u podacima. Najpre će biti prikazan test normalnosti slučajne greške u probit modelu za uporedne podatke. Sličan test se primenjuje i u Tobit modelu. Nakon toga, predstaviće se testovi kojima se istovremeno ispituje normalnost komponenata slučajne greške u modelima panela. 39 Detaljnije o dekomponovanju informacione matrice na komponente koje su osnova za testiranje nulte hipoteze o homoskedastičnosti i normalnosti slučajne greške videti npr. u Chesher i Irish (1987: str. 38- 39). Analiza razlika u zaradama i višestrukog izbora zaposlenja 74 Polazeći od pristupa koji su razvili Bera et al. (1984), kao i od prikaza procedure testiranja Verbeek-a (2002), ispitivanje nulte hipoteze o normalnosti slučajne greške probit modela 40 (H0: E( 3 i )=0 i E( 24 3  i )=0), nasuprot alternativnoj da nisu postavljena ograničenja na uslovne momente trećeg i četvrtog reda, može da se sprovede na način da se probit model verovatnoće da je vrednost zavisne promenljive iy jednaka jedan, za dati skup objašnjavajućih promenljivih ix , izrazi:  3'22'1' )()()()1(  iiiii xxxFxyP  . Iz ovoga proizlazi da se u probit modelu testiranje odsustva normalnosti zasniva na nultoj hipotezi da su parametri uz dva dodatna člana modela jednaki nula (H0: 021  ). 41 Testiranje se sprovodi na osnovu pomoćne regresije jediničnog vektora na 'ˆ iix , 2' )ˆ(ˆ  ii x i 3' )ˆ(ˆ  ii x , gde je iˆ uopšteni rezidual ocenjenog probit modela (Gourieroux et al. 1987), nakon čega se odgovarajuća statistika testa LM izračuna kao umnožak N 2R . Statistika testa, pod H0, ima asimptotsku 2 raspodelu sa 2 stepena slobode. Gore izložena procedura testiranja normalnosti se zasniva na dokazu Ruud-a (1984: str. 215-217) koji je koristio Pearson-ovu familiju raspodela  (.) koja sadrži normalnu, studentovu, beta i gama raspodelu, da bi se definisala odgovarajuća statistika testa. Pod alterantivnom hipotezom se tvrdi da raspodela verovatnoća slučajne greške modela može da se izrazi u obliku funkcije raspodele koja ima karakteristike koje su svojstvene Pearson-ovoj familiji raspodela: )()( 32 2 1 ttttP i   , (3.3) gde je t odgovarajuća funkcija od )( 'ix . Ova raspodela može da ima 01  i 02  , a svodi se na normalnu ako su 021  , što je pretpostavka postavljena nultom hipotezom. Dakle, ovaj test normalnosti je ekvivalentan LM testu za normalnu protiv šire Pearson-ove familije raspodela, a dobija se na bazi poređenja izračunatih sa hipotetičkom vrednošću trećeg i četvrtog momenta funkcije raspodele slučajne greške. 40 Procedura testiranja nulte hipoteze o normalnosti slučajne greške Tobit modela prikazana je u Verbeek (2002: str. 206). 41 Što je ekvivalentno testu specifikacije slučajne greške, odnosno testu značajnosti isključenih regresora. Analiza razlika u zaradama i višestrukog izbora zaposlenja 75 Prema prikazanoj proceduri, ovaj test se na sličan način može koristiti i u testiranju normalnosti komponenata slučajne greške  it,i u probit i Tobit modelima sa primenom na podacima panela. Takođe, pod nultom hipotezom o normalnoj raspodeli komponenata slučajne greške, statistika testa LM ima asimptotsku 2 raspodelu sa 2 stepena slobode. Uz gore već izložene testove, sistematičan pregled testova za testiranje specifikacije slučajne greške, heteroskedastičnosti i odsustva normalnosti u modelima izbora podataka i šire u modelima zavisne promenljive sa ograničenjem u podacima su prikazali, na primer, Chesher i Irish (1987), Newey (1987) i Pagan i Vella (1989). Veliki broj ovih testova se bazira na Newey-evom (1985) pristupu testiranja validnosti ograničenja u uslovnim momentima za koje se pretpostavlja da važe u ekonometrijskim modelima. 3.2 Hausman-ov test specifikacije Tretman individualnih efekata i u modelu panela otvara nekoliko pitanja koja su veoma važna pri izboru specifikacije modela. Standardni pristup se svodi na izbor između modela sa fiksnim i modela sa slučajnim efektima. Izbor specifikacije modela podataka panela sastoji se u primeni procedure testiranja koju je razvio Hausman (1978), kojom se pod nultom i alterantivnom hipotezom tvrdi sledeće: 0)|(:0 iti xEH  (3.4) 0)|(:1 iti xEH  (3.5) Neodbacivanje nulte hipoteze znači da ne postoji korelisanost između itx i i , kada su obe ocene nepristrasne, dok je ocena modela slučajnih efekata dodatno i efikasna, odnosno konzistentna i asimptotski efikasna u velikim uzorcima. Ako se nulta hipoteza odbaci ocena modela fiksnih efekata ostaje i dalje nepristrasna i konzistentna, ali ocena Analiza razlika u zaradama i višestrukog izbora zaposlenja 76 modela slučajnih efekata postaje pristrasna i nekonzistentna. Formalno, Hausman-ova statistika testa (H) se izražava u sledećem obliku:   )~ˆ()~(~)ˆ(ˆ)~ˆ( 1'   arVarVH , (3.6) gde su ˆ i  ~ ocene nepoznatih regresionih parametara modela fiksnih i slučajnih efekata iz kojih je isključen slobodni član, sa pripadajućim matricama ocenjenih varijansi i kovarijansi )(ˆ arV i )( ~ arV , respektivno. U slučaju kada je nulta hipoteza tačna, razlika između ovih ocena u limesu verovatnoće teži nuli (plim ) ~ˆ(   =0), čime se i izbor modela slučajnih efekata potvrđuje kao tačan. Statistika testa H pod nultom hipotezom ima asimptotsku 2 raspodelu sa (K-1) stepeni slobode, pri čemu je K broj nepoznatih regresionih parametara  . Primena poluparametarskih metoda daje konzistentne ocene regresionih parametara čak i kada su narušene polazne pretpostavke o normalnoj raspodeli i homoskedastičnosti slučajne greške (videti tačku 2.2.5). Međutim, zahvaljujući parametarizaciji koju je postavio Ruud (1984), ispunjeni su uslovi za primenu Hausman-ovog testa specifikacije (Hausman 1978). Test se zasniva na razlici ocena regresionih parametara dobijenih primenom određenog parametarskog i poluparametarskog metoda i ima formu standardnog Hausman-ovog testa (3.6). Vektori parametara i matrice varijansi i kovarijansi zamenjuju se odgovarajućim ocenama koje su dobijene primenom datog parametarskog i poluparametarskog metoda. Ukoliko se nulta hipoteza o normalnoj raspodeli odbaci, predlaže se primena alterantivnih poluparametarskih metoda ocenjivanja regresionog modela ili izbor takvih parametarskih metoda ocenjivanja kojima bi se otklonili problemi odsustva normalnosti i heteroskedastičnosti. Hausman-ov test se takođe može koristiti i za poređenje ocena dobijenih drugim metodima ocenjivanja. Na primer, moguće je porediti ocene OLS regresije sa ocenama modela izbora podataka i/ili Tobit modela i to kako za uporedne tako i za podatke panela. Nultom hipotezom se testira da ne postoje sistematske razlike u ocenama Analiza razlika u zaradama i višestrukog izbora zaposlenja 77 parametara. Hausman-ov test glasi jjjj arVH  ˆˆˆ 1'  , gde je jˆ vektor razlika ocena dobijenih primenom dva metoda koja se porede, a 1ˆ jarV je inverzna matrica varijansi i kovarijasi poređenja ocena. Procedura zaključivanja je standardna. Uslov za izvođenje zaključaka na bazi Hausman-ovog testa jeste da je ocenjena matrica varijansi i kovarijansi između ocena dva modela pozitivno definitna. Međutim, u konačnim uzorcima ocenjena matrica može biti i negativno definitna, tako da nije moguće izračunati njenu inverznu matricu, pa primena ove statistike testa ostaje bez zaključka. Testiranje može da se sprovede na podskupu ocenjenih parametara. Takođe, izračunata vrednost statistike testa može biti negativna. U toj situaciji, predlaže se da se nulta hipoteza ne odbaci. 42 3.3 Pristrasnost usled neslučajnog izbora podataka u panelu U ovoj tački izloženi su testovi pristrasnoti usled neslučajnog izbora podataka koji se koriste u modelima izbora sa fiksnim i slučajnim efektima, kao i u Tobit modelima za cenzurisane podatke. 43 Prvi test pristrasnosti usled neslučajnog izbora jedinica posmatranja u panelu se zasniva na pristupu koji je razvio Wooldridge (1995), a koji je delom izložen u tački 2.2.5.1.44 Problem koji izaziva pristrasnost se posmatra u kontekstu analize verovatnoće sa kojom je data jedinica posmatranja izabrana u uzorak. Polazni model za testiranje pristrasnosti (koja vodi nekonzistentnim ocenama regresionih parametara) je dat u formi Tobit modela (ili modela izbora podataka) sa fiksnim efektima. Polazeći od jednačina (2.25a) i (2.27a), specifikacija modela fiksnih efekata za cenzurisani uzorak se može prikazati na sledeći način: it '   iitit xy , i=1,2,..,N, t=1,...,T, (3.7) 42 Videti npr. Hausman i McFadden (1984) za dalja objašnjenja o statističkom zaključivanju na bazi primene Hausman-ovog testa u konačnim uzorcima. 43 Ove testove moguće je modifikovati i za primenu u modelima sa odsečenim podacima zavisne promenljive. 44 Ovaj pristup se zasniva na sličnim procedurama testiranja koje su za uporedne podatke razvili Smith i Blundell (1986) i Vella (1992). Analiza razlika u zaradama i višestrukog izbora zaposlenja 78 gde je ity zavisna promenljiva koja se posmatra samo ako je 1itd . Zbog jednostavnosti prikaza, iz modela su isključene veštačke promenljive za vremenske efekte, a čije prisustvo je dozvoljeno u specifikaciji modela, kao i interakcija ovih efekata sa promenljivim koje su fiksne kroz jedinice posmatranja, ali ne i kroz vreme. Zatim se za svako t=1,...,T obrazuje latentna promenljiva koja determiniše proces izbora jedinica posmatranja u uzorak: it ' 1 ' 10 * ...   ii tTiTtitit zzd , (3.8) gde je it nezavisno od i i ' iz i ima normalnu raspodelu, a ts je (Kx1) vektor nepoznatih parametara, t,s=1,..., iT (t≠s). Razlikuju se dve procedure testiranja. Prva kojom se testiranje sprovodi kada se latentna promenljiva može parcijalno posmatrati,45 a koja odgovara primeni Tobit analize u ocenjivanju jednačine izbora (3.8) i druga kojom se jednačina izbora ocenjuje na bazi probit modela, tj. kada se samo posmatra binarna promenljiva koja je indikator izbora jedinice posmatranja u uzorak. Ovde će biti prikazana samo prva procedura testiranja. Nulta hipoteza glasi: H0:   0,,| iiiit dzE  , (3.9) a alternativna hipoteza, kojom se tvrdi da postoji pristrasnosti zbog neslučajnog izbora jedinica posmatranja je (Wooldridge 1995): H1:   iti ,,,|  iiiit dzE . (3.10) 45 Wooldridge (1995: str. 120) definiše pojam parcijalnog posmatranja latentne promenljive na način da se za svako t polazi od pretpostavke da se cenzurisana promenljiva itd posmatra samo kada je zadovoljen uslov ),0max( *itit dd  . Drugim rečima, binarna promenljiva, tj. indikator izbora jedinice posmatranja u uzorak, definisana je kao 1itd ]0[ * itd . Analiza razlika u zaradama i višestrukog izbora zaposlenja 79 Iz (3.10) proizlazi da je očekivana vrednost od it nezavisna od  it1it1-iti1 ,...,,,...,,,  ii z u odnosu na it . Procedura testiranja se sprovodi u tri koraka: 1. Za svaki vremenski period t ocenjuje se posebna jednačina izbora podataka u formi standardnog Tobit modela: ),0max( it '   itit zd , i=1,2,..,N, t=1,...,T, (3.11) gde 'itz uključuje jedinicu kao prvi element. Za svako 1itd generiše se serija dobijenih reziduala,  ˆˆ 'it itit zd  . 2. Metodom OLS se ocenjuje sledeća jednačina: itititit xy   ~~~ ' , (3.12) na cenzurisanom uzorku opservacija za koje je 1itd . Promenljive ity ~ i itx ~ (su već definisane u tački 2.2.5.1, a    iT s isis i itit d T 1 * ˆ 1 ˆ~  , t,s=1,..., iT (t>s). 3. Primenom t-testa se ispituje značajnost ocene parametra ˆ uz promenljivu it ~ , tj. testira se H0: 0 . Primena ovog testa podrazumeva da su standardne greške ocena parametara (  ˆ,ˆ ) robustne u uslovima autokorelacije i heteroskedastičnosti.46 U kontekstu primene modela sa slučajnim efektima, Verbeek i Nijman (1992) su razvili tri testa za ispitivanje pristrasnosti, koji se takođe zasnivaju na testiranju statističke značajnosti dodatnog člana u modelu. Wooldridge (1995) ne nalazi mogućnost primene za dva testa u modelima sa fiksnim efektima, zbog toga što je dodatni član, dat kao iT i   iT s isd 1 , fiksan kroz vreme, te se samo značajnost člana 1itd može testirati u modelima sa fiksnim efektima. Takođe, predlaže i da se umesto ocene inverznog Mills-ovog 46 Ukoliko su ovi uslovi narušeni, Wooldridge (1995: str. 131-132) predlaže proceduru korekcije kako bi se ocenila matrica robusnih varijansi za ''2 )ˆ,ˆ(ˆ   . Analiza razlika u zaradama i višestrukog izbora zaposlenja 80 količnika, u postupku testiranja značajnosti dodatnog člana u modelu sa fiksnim efektima koristi   iT ts isd ili   iT ts isd , čime se omogućuje primena Heckman-ovog (1976) pristupa u modelima kojima su osim prisustva potencijalne pristrasnosti usled neslučajnog izbora podataka obuhvaćeni i neopaženi efekti. Vella i Verbeek (1999) su razvili test pristrasnosti uključivanjem dva člana ( itvˆ i ivˆ ), dobijena ocenjivanjem redukovane forme Tobit modela sa slučajnim efektima, u osnovnu regresionu jednačinu koja se zatim ocenjuje metodom OLS (videti tačku 2.2.5.2).47 Semykina i Wooldridge (2010) definišu dva tipa testova za otkrivanje pristrasnosti za nebalansirane podatke panela. Prvi test se odnosi na testiranje pristrasnosti koja se javlja u istom vremenskom periodu (en. contemporaneous selection bias), kada su neke od objašnjavajućih promenljivih korelisane sa slučajnom greškom, a rezultati ovog testa ostaju validni ukoliko postoji proizvoljna korelisanost između individualnih (neopaženih) efekata i objašnjavajućih promenljivih. Drugi test, koji će biti detaljnije izložen, zasniva se na testiranju značajnosti dodatnih članova u osnovnoj regresionoj jednačini modela izbora podataka. Ovim testom se otkriva postojanje pristrasnosti usled narušenosti pretpostavke o strogoj egzogenosti itz u odnosu na i . U modelu izbora podataka sa fiksnim efektima koji se ocenjuje primenom dvostepenog metoda najmanjih kvadrata (en. fixed effects two-stage least squares – FE-2SLS), Semykina i Wooldridge (2010) definišu svoju proceduru testiranja pristrasnosti. Nulta hipoteza, koja glasi: H0:   0,,| iiiit dzE  (3.13) i alternativna hipoteza, kojom se tvrdi da postoji pristrasnost usled neslučajnog izbora jedinica posmatranja: H1:    itiitiiiit dzEdzE ,,,|   (3.14) 47 Takođe, u modelima izbora i Tobit modelima za uporedne podatke najčešće se koriste npr. testovi pristrasnosti koje su razvili Melino (1982), Newey (1985), Vella (1992) i dr. Analiza razlika u zaradama i višestrukog izbora zaposlenja 81 mogu da se testiraju dodavanjem članova sledećem “proširenom” modelu:   it' ,   itiitiitit dzExy , t=1,...,T. (3.15) Model (3.15) se ocenjuje FE-2SLS metodom uz polaznu pretpostavku o slučajnoj grešci it :   0,,| iiiit dzE  . Test pristrasnosti se zatim sprovodi testiranjem H0: 0 u modelu (3.15). Procedura testiranja se odvija u sledeća tri koraka (Semykina i Wooldridge 2010): 1. Za svaki vremenski period t ocenjuje se posebna jednačina izbora (selekcije) podataka u formi standardnog probit modela: ]0[1 it '  uzzd iitit  , (3.16) gde 'itz uključuje jedinicu kao prvi element, a it ~ )1,0( aN  . Individualni efekti su iii az   , a iz je definisano sa    T t iti z T z 1 1 , tako da se slučajna greška itu u probit modelu (3.16) daje izrazom itiau it . Ocene probit modela se zatim koriste kako bi se generisala nova promenljiva  atiatit zz  ˆˆˆ 'it  . 2. Metodom FE-2SLS se ocenjuje sledeća jednačina: itit ' ˆ   iitit xy , (3.17) na cenzurisanom uzorku opservacija za koje je 1itd . Promenljive itz ~ (koje uključuju objašnjavajuće promenljive probit modela) i itˆ se koriste kao instrumenti za 'itx u dvostepenoj proceduri ocenjivanja, pri čemu važi striktan uslov da je itit zz  ~ , što, drugim rečima, znači da je podskup instrumentalnih promenljivih itz ~ najmanje reda (1xK) kako bi bio zadovoljen uslov identifikacije. Ovim uslovom je obezbeđeno da se napravi razlika između skupa egzogenih promenljivih koje su dobri instrumenti za 'itx u slučaju odsustva pristrasnosti od skupa egzogenih promenljivih koje se koriste da bi se predvidela pristrasnost usled neslučajnog izbora Analiza razlika u zaradama i višestrukog izbora zaposlenja 82 podataka. Takođe, u specifikaciji modela (3.17) se dozvoljava prisustvo članova interakcije itˆ sa veštačkim promenljivim za vreme kako bi se mogli pratiti efekti pristrasnosti usled neslučajnog izbora jedinica posmatranja u različitim vremenskim tačkama, t=1,...,T. 3. t-testom se ispituje značajnost parametra  uz promenljivu itˆ u modelu (3.17), tj. testira se H0: 0 , odnosno Wald-ovim testom se ispituje združena značajnost za svih t parametara, t=1,...,T, ili H0: 0...1  T . Primena ovog testa ne zahteva da se standardne greške ocena parametara u modelu (3.17) koriguju rezultatima ocenjivanja probit modela, ali podrazumeva da su one robustne u uslovima postojanja autokorelacije i heteroskedastičnosti.48 48 U suprotnom, kao i kod prethodnog postupka testiranja pristrasnosti usled neslučajnog izbora, predlaže se procedura čijom primenom se dobijaju robusne standardne greške (videti Wooldridge 1995: str. 131- 132). Analiza razlika u zaradama i višestrukog izbora zaposlenja 83 4. EKONOMSKI MODELI FUNKCIJE ZARADA U ovom poglavlju doktorske disertacije će biti izloženi ekonomski modeli zarada koje ćemo koristiti u empirijskom modeliranju zaradama (Mincer 1974), sa ciljem utvrđivanja rodnih razlika, kao i višestrukog izbora zaposlenja (Shishko i Rostker 1976). Stoga je na početku korisno da definišemo osnovne pojmove analize ponude rada na način na koji su oni definisani u klasičnim udžbenicima iz ekonomije rada (videti npr. Borjas 2008). Standardni koncept ponude rada posmatra ovaj ekonomski fenomen u kontekstu statičke analize (Borjas 2008). Prema ovom konceptu ponuda rada se posmatra u neoklasičnom modelu izbora između rada i dokolice (en. neoclassical model of labour-leisure choice). Preciznije rečeno, svaki pojedinac se nalazi pred izborom da maksimizira svoju funkciju korisnosti, koja odražava nivo željene potrošnje dobara i dokolice, pri datom skupu budžetskih ograničenja. Skup budžetskih ograničenja čine ukupan dohodak i raspoloživo vreme, pri čemu se ukupan dohodak deli na deo dohotka od rada (tj. zaradu) koji zavisi od broja časova rada i na deo neradnog dohotka (npr. dohodak od kapitala, nasleđe, dobici od igara na sreću i tome slično) koji ne zavisi od broja časova rada. U središtu modela izbora između rada i dokolice se nalazi pojedinac koji je zaposlen. Analiza koja proizlazi iz ovog modela se zasniva na pretpostavci da racionalni pojedinac prilikom svog izbora između potrošnje dokolice i potrošnje ostalih dobara proizvodi efekat dohotka i efekat supstitucije. Između ova dva efekta ne postoji balans, a u zavisnosti od toga koji od njih preteže dolazi do povećanja ili do smanjenja ponude rada. Polazeći od pretpostavke da je dokolica normalno dobro, što znači da, pri konstantnoj ceni ostalih dobara, sa porastom dohotka dolazi do porasta potražnje za dokolicom, Borjas (2008) objašnjava da se efekat dohotka javlja kada raste dohodak koji ne vodi poreklo od rada, tako da, pri konstantnom povećanju stope zarada, pojedinac bira da smanji broj časova rada da bi više uživao u dokolici. Nasuprot tome, efekat supstitucije nastaje onda kada povećanje stope zarada, pod uslovom da je realni dohodak konstantan, dovodi do povećanja broja časova rada, što se, zatim, odražava na smanjenje potražnje za dokolicom, čija cena raste sa porastom dohotka (od rada). Ova dva efekta proizvode dvojnu relaciju između povećanja stope zarada i broja časova rada Analiza razlika u zaradama i višestrukog izbora zaposlenja 84 (Borjas 2008). S jedne strane, povećanje stope zarada pozitivno utiče na broj časova rada samo ukoliko efekat supstitucije dominira nad efektom dohotka, povećavajući ponudu rada. S druge strane, povećanje stope zarada negativno utiče na broj časova rada ukoliko važi obrnuto, tj. kada efekat dohotka dominira nad efektom supstitucije, čime se povećava potražnja za dokolicom i smanjuje ponuda rada. Od posebnog interesa za analizu razlika u zaradama muškaraca i žena jeste definisanje relacije između tržišne i rezervacione zarade, koja utiče na izbor žena da rade, time što “žrtvuju” deo vremena, koji bi inače bio potrošen na dokolicu odnosno na rad u domaćinstvu, zarad plaćenog posla koji im omogućava sticanje dohotka kojim se mogu kupiti i druga dobra. Teorijske postavke ekonomskih modela ponude rada žena i prve empirijske rezultate su dali Mincer (1962a), Gronau (1974) i Heckman (1974). Odluka žena da rade zavisi od mnoštva faktora, kao što ćemo kasnije videti, a osnovni izbor potiče od odnosa između tržišne i rezervacione zarade, s tim, da će žena doneti pozitivnu odluku samo pod uslovom da je taj odnos veći od jedinice, tj. da tržišna zarada ili zarada koju je poslodavac spreman da plati preteže nad željenom ili rezervacionom zaradom. Gore izložena teorija o odnosu između povećanja stope zarada i broja časova rada dovodi do zaključka da će pojedinci sa većim zaradama biti skloniji ka tome da se opredele da rade, što implicite dovodi do porasta ponude određene kategorije rada i može da se odrazi na neprecizno merenje stvarnog jaza u zaradama muškaraca i žena. Ukoliko u središte pažnje stavimo ponudu rada žena, jednostavno se može zaključiti da je povećanje stope zarada žena vodilo ka porastu učešća žena u radnoj snazi, a time i do toga da je efekat supstitucije dominantniji od efekta dohotka. Neophodno je, takođe, osvrnuti se na ukupnu ponudu rada i na značaj koji je imalo formiranje ponude rada žena u socijalističkoj Jugoslaviji, kao i u Srbiji, i uporediti je sa ostalim socijalističkim zemljama tadašnje Evrope i bivšeg Sovjetskog Saveza. Zajednička nit koja povezuje sve te zemlje jeste da su žene u socijalizmu bile “bodrene” da se aktivno uključe u radnu snagu, ne samo zbog ideoloških razloga, već i zbog činjenice da je tim zemljama bila potrebna radna snaga zbog intenzivne industrijalizacije (Brainerd 2000). Međutim, stope učešća žena u ženskoj radnoj snazi u socijalističkoj Jugoslaviji nisu bile toliko visoke kao u ostalim socijalističkim zemljama. Analiza razlika u zaradama i višestrukog izbora zaposlenja 85 Moglo bi se čak reći da su žene u socijalističkoj Jugoslaviji imale mogućnost slobodnog izbora, kada je reč o radnom angažovanju, što je imalo i svoje ustavno utemeljenje, budući da im je bila garantovana društvena i ekonomska jednakost sa muškarcima, jednaka nagrada za jednak rad, kao i zaštita prava i institucionalna podrška kada su želele da se ostvare kao majke (Petrin i Humphries 1980). U jeku intenzivne industrijalizacije i masovnog uključivanja ruralne populacije u radnu snagu, stope učešća muškaraca su iznosile oko tri petine, a žena tek nešto ispod jedne trećine (Petrin i Humphries 1980). Kasniji razvoj zemlje i priliv obrazovane radne snage, a naročito žena, na tržište rada, doveli su do rasta stopa učešća u stanovništvu radnog uzrasta kod obe demografske grupe, tako da je u Srbiji, krajem 1990-ih godina, stopa učešća ženske radne snage iznosila blizu tri petine, a muškaraca nešto više od dve trećine (Krstić i Reilly 2000). S druge strane, stope učešća ženske radne snage u većini preostalih post- socijalističkih zemalja iznosile su oko četiri petine (Brainerd 2000). Danas su stope učešća radne snage među post-socijalističkim zemljama, od kojih su većina već članice ili su kandidati za članstvo u EU, daleko neujednačenije i odražavaju nivo dostignutog razvoja, institucionalne preduslove, društvene norme i brojne druge ekonomske i socijalne faktore. Izloženi koncept, dakle, omogućava da se razviju ekonomski modeli na osnovu kojih će se dobiti odgovor na pitanje koji faktori određuju da li će dati pojedinac da se aktivno uključi u tržište rada, i ako hoće, kakav će biti njegov izbor u pogledu broja časova rada, što direktno utiče na obim ponude rada. Alokacija ukupnog raspoloživog vremena pojedinca između rada i svih drugih aktivnosti, koje pored vremena utrošenog na zadovoljenje egzistencijalnih potreba i na dokolicu, uključuje i druge oblike potrošnje, već dugo zaokuplja pažnju ekonomista. Vredan teorijski doprinos o produktivnoj potrošnji, koja se zasniva na vremenu predviđenom za obavljanje svih ostalih neradnih aktivnosti, dao je Becker (1965). Becker-ova teorija alokacije ukupnog vremena pojedinca neće biti šire analizirana u doktorskoj disertaciji, izuzev u onom segmentu koji se odnosi na izbor između povećanja ukupnog broja časova rada kroz izbor dodatnog zaposlenja a na uštrb smanjenja vremena koje bi bilo potrošeno na dokolicu. Naime, prema standardnoj teoriji o izboru dodatnog zaposlenja, zaposleni pojedinac koji želi da radi više časova na osnovnom poslu, ali mu to nije omogućeno zbog ograničenog Analiza razlika u zaradama i višestrukog izbora zaposlenja 86 ukupnog broja časova rada, bira dodatni posao ako stopa zarada koju ostvaruje na dodatnom poslu prevazilazi stopu rezervacione zarade pri kojoj se opredeljuje za dodatni posao, odnosno njegov interes za dodatnim poslom postoji sve dok stopa zarada na tom poslu prevazilazi marginalnu stopu supstitucije između dohotka i dokolice (Shishko i Rostker 1976). 4.1 Klasični modeli vrednovanja ljudskog kapitala 4.1.1 Ulaganje u ljudski kapital – teorijski pristup Teorijski okvir za definisanje funkcije zarada zasnovane na vrednovanju ljudskog kapitala (en. human capital earnings function) je postavio Mincer (1958, 1974). Međutim, pre nego što je definisana Mincer-ova funkcija zarada, koja je našla svoje mesto u brojnim empirijskim studijama o ponudi radne snage, teorijska rasprava, kojoj su značajan doprinos u ekonomskoj literaturi, pored Mincer-a (1958), dali Becker (1962) i Ben-Porath (1967), vođena je oko razvijanja formalnog modela ulaganja u ljudski kapital. Mincer-ov pristup o zasnivanju funkcije zarada na vrednovanju ljudskog kapitala ima svoje ishodište u teoriji raspodele dohotka pojedinca (en. the theory of personal income distribution). Pri razvijanju svog modela, Mincer (1958) se rukovodio činjenicom da stečena znanja, ne samo tokom formalnog obrazovanja, već i kasnije kroz različite vidove obuka, kao i tokom procesa rada, unapređuju individualnu produktivnost i čine da se zarade razlikuju među pojedincima, doprinoseći većoj ili manjoj nejednakosti u zaradama. Postavio je jednostavan model koji podrazumeva da se ulaganje u ljudski kapital odvija kroz procese sticanja znanja među potencijalnim učesnicima u radnoj snazi i da svi pojedinci imaju jednake sposobnosti i iste šanse da izaberu određeno zanimanje. Budući da vreme provedeno u sticanju znanja tokom školovanja odlaže početak zaposlenja, čime se smanjuje i ukupan vremenski period primanja budućih zarada, sadašnja vrednost zarada koju bi primao neki pojedinac tokom svog radnog veka mora da se svede na vreme koje teče od trenutka njegove odluke da se uključi u proces sticanja određenog zanimanja. Mincer (1958) je ovim svojim radom postavio osnove koncepta “profil godine starosti- Analiza razlika u zaradama i višestrukog izbora zaposlenja 87 zarada” (en. age-earnings profile), koji oslikava putanju zarada tokom radnog veka pojedinaca, a ovaj koncept ćemo koristiti u nastavku ovog poglavlja da bismo objasnili funkciju zarada. Na primer, pokazalo se da je u post-socijalističkim zemljama Evrope porast nejednakosti u zaradama s kraja 1980-ih i s početka 1990-ih godina, odnosno na početku perioda ekonomske tranzicije, značajno uticao na povećanje nejednakosti raspodele ukupnog dohotka pojedinca (Milanovic 1999). K tome, značajan porast stopa prinosa na komponente ljudskog kapitala, kasnije, tokom perioda ekonomske tranzicije, učinio je da se raspodele zarada među učesnicima u radnoj snazi veoma razlikuju (Orazem i Vodopivec 1997; Münich et al. 2005).49 Becker (1962) proširuje klasični model ulaganja u ljudski kapital, podrazumevajući pod ljudskim kapitalom, ne samo rezultate ulaganja u formalno obrazovanje i znanje stečeno na radnom mestu kroz obavljanje radnih zadataka i pohađanje obuka, već i u druge vrste znanja, kao što su informacije, zdravlje i moral, ili u ona znanja koja se postižu zahvaljujući migracijama (tj. zahvaljujući geografskoj mobilnosti radne snage). Ulaganje u ljudski kapital, prema Becker-u (1962), definiše se kao skup aktivnosti koje utiču na budući tok realnog dohotka50 pojedinaca kroz unapređenje njihovih resursa. Stoga, svoj teorijski model ulaganja u ljudski kapital, Becker (1962) zasniva na pretpostavci da svaki pojedinac koji se uključuje u proces obrazovanja trenutno vrednuje zarade manje, nazivajući ih troškovima ulaganja, ali očekuje veće zarade u budućnosti, nazivajući ih prinosima na ulaganja, a ono što povezuje te dve veličine se naziva internom stopom prinosa. Takođe, kao što je istaknuto na početku ovog pasusa, i Becker pravi razliku između formalnog obrazovanja i obrazovanja koje se stiče obukama nakon završetka procesa formalnog obrazovanja, a što se može izjednačiti sa neformalnim vidovima obrazovanja, ali, pri tome, razlikuje dva načina sticanja neformalnog obrazovanja. Prvi, putem pohađanja specifičnih vidova obuka, stiče se kod 49 O načinu određivanja i kontroli raspodele zarada u socijalističkoj Jugoslaviji videti u Vodopivec (1993). 50 Pod pojmom realni dohodak, autor podrazumeva realni dohodak od rada. U nastavku izlaganja u ovom poglavlju, pod pojmom dohodak će se uglavnom podrazumevati dohodak od rada, ukoliko nije drugačije navedeno, i koristiće se naizmenično sa pojmom zarada. U poglavlju 7, precizno će se definisati promenljive veličine koje će biti korišćene za empirijsku analizu. Analiza razlika u zaradama i višestrukog izbora zaposlenja 88 određenog poslodavca, a tako stečena znanja najčešće nisu prenosiva na poslove kod drugih poslodavaca. Drugi, putem pohađanja opštih kurseva, omogućuje sticanje prenosivih znanja koja mogu da se koriste i kod drugih poslodavaca. Ove teorijske analize su potkrepljene brojnim primerima u praksi, a danas su zastupljene kako u individualnim politikama ulaganja u obuke zaposlenih tako i u aktivnim politikama na tržištu rada kroz kreiranje obuka namenjenih učesnicima koji aktivno traže posao. Dakle, u centru pažnje oba, i Mincer-ovog (1958) i Becker-ovog (1962) pristupa, nalaze se “zanimanja,” kao ekvivalent složenosti procesa i nivoa dostignutog obrazovanja. U Ben-Porath-ovom (1967) pristupu o teoriji ulaganja u ljudski kapital, središnju pažnju zauzima klasična Cobb-Douglas-ova proizvodna funkcija. Njegov model proizvodne funkcije ljudskog kapitala služi za merenje toka proizvodnje ili za kreiranje ljudskog kapitala koji je rezultat kombinovanja neophodnih inputa kupljenih po određenoj ceni, uloženog vremena i količine već postojećeg ljudskog kapitala uložene u proizvodnju. Trošak ulaganja u proizvodnju ljudskog kapitala, dakle, predstavlja razliku između ukupne količine usluga koju dati pojedinac može da ponudi na tržištu po određenoj ceni i raspoloživih zarada koje predstavljaju deo tekućih zarada kojima mogu da se kupe potrošna dobra ili druga sredstva koja nisu deo ljudskih resursa. Pri definisanju ovog modela, koji predstavlja korak dalje u odnosu na koncept ulaganja u ljudski kapital koji su razvili Mincer (1958) i Becker (1962), Ben-Porath (1967) se rukovodi time da svaki pojedinac ima za cilj da maksimizira sadašnju vrednost zarada koje bi primao tokom radnog veka. Ovaj pristup podrazumeva da su ulaganja u kreiranje sopstvenog ljudskog kapitala najveća u mladosti i da neprekidno opadaju tokom životnog ciklusa, tokom kojeg se odvija i apresijacija stoka ljudskog kapitala, tako da u trenutku odlaska u penziju ili u trenutku donošenja odluke o trajnom isključenju iz radne snage vrednost ljudskog kapitala opada na nulu. Isto tako, to znači da su ostvarene zarade niže u prvim godinama životnog ciklusa i da rastu po opadajućoj stopi, kako se prinosi na ulaganja realizuju, i smanjuje vrednost uloženih investicija. Analiza razlika u zaradama i višestrukog izbora zaposlenja 89 4.1.2 Funkcija zarada zasnovana na vrednovanju ljudskog kapitala Mincer (1974) je tek kasnije postavio formalan model funkcije zarada koja se zasniva na vrednovanju ljudskog kapitala i svoju teoriju empirijski testirao ocenjivanjem nekoliko ekonometrijskih specifikacija. Njegov model je, u osnovi, imao za cilj da postavi jednostavnu relaciju između posmatranih zarada, obrazovanja51 i radnog iskustva. Pretpostavke na kojima počiva ovaj model su da je ulaganje u ljudski kapital, iskazano godinama provedenim u sticanju određenog nivoa obrazovanja, konstantno, kao i da ulaganje u ljudski kapital nakon završetka školovanja linearno opada tokom životnog ciklusa, što ukazuje na konkavan oblik funkcije zarada i radnog iskustva.52 Iz ove poslednje pretpostavke proizlaze osnove koncepta “profil radno iskustvo-zarada” (en. experience-earnings profile) koji konkavan oblik raspodele zarada tokom životnog ciklusa tumači smanjenjem stope ulaganja u ljudski kapital, pri čemu ova stopa predstavlja odnos investicija i potencijalnih zarada. Radno iskustvo zauzima, dakle, značajno mesto u funkciji zarada, pošto objašnjava proces ulaganja u ljudski kapital koji se odvija nakon završetka formalnog obrazovanja (ili prema izvornoj Mincer-ovoj terminologiji: en. on-the-job training). Stoga je o načinu merenja ove promenljive u funkciji zarada često diskutovano. Mincer (1974: str. 84) je prvobitno uključio radno iskustvo u funkciju zarada dodavanjem linearnog i kvadratnog člana, ali je definisao i alternativnu meru “potencijalno radno iskustvo,” koje odražava razliku između trenutnog broja godina starosti određenog pojedinca, vremena provedenog u školi i broja godina koje je pojedinac imao na početku svog školovanja. Međutim, empirijske studije su pokazale da ovako iskazano radno iskustvo ne predstavlja približnu meru stvarnog broja godina radnog iskustva, naročito u populaciji ženske radne snage (Knight i Sabot 1981). Stoga su Buchinsky (1998b), a takođe i drugi autori, na primer, Lambert (1993) i Martins (2001), koristili modifikovanu meru radnog iskustva koja izražava korekciju ukupnog broja godina radnog iskustva za prisustvo određenog broja dece u porodici, u specifikovanju empirijske funkcije zarada žena. Međutim, u svom ranijem 51 U osnovi interpretacije koeficijenta uz promenljivu godine obrazovanja, kao prinosa na obrazovanje, u Mincer-ovoj funkciji zarada, nalazi se teorijski rezultat koji su Becker i Chiswick objavili u svom radu 1966. godine, a zatim je korišćen i u Mincer-ovom radu 1974. godine (citirano prema Heckman et al. 2006: str. 311). 52 Model kojim se iskazuje linearna veza samo između zarada i vremena provedenog u sticanju formalnog obrazovanja se naziva primitivnom funkcijom zarada (Mincer 1974: str. 11). Analiza razlika u zaradama i višestrukog izbora zaposlenja 90 radu, Mincer (1962b: str. 67) se osvrnuo na problem razlika u ulaganju u ljudski kapital između muškaraca i žena, nakon završetka formalnog obrazovanja, ističući da “iako troškovi formalnog obrazovanja nisu mnogo manji za žene nego za muškarce, ulaganja u obuke po završetku formalnog obrazovanja su veoma mala […] u svetlu teorije investicija […] prosečna žena [u SAD-u] očekuje da će provesti manje od polovine svog radnog veka aktivno se angažujući u radnoj snazi [zbog odgajanja dece]” [prevod autora]. Stoga, može da se zaključi da je i sam Mincer imao u vidu razlike koje radno iskustvo potencijalno može da ima na formiranje oblika raspodele zarada muškaraca i žena i da je to kasnije prepoznato kao problem u empirijskom modeliranju zarada i kod drugih autora. Kasnije studije o tome, kako tržište rada vrednuje komponente ljudskog kapitala tokom perioda ekonomske tranzicije u zemljama bivšeg Sovjetskog Saveza, kao i u zemljama bivše Jugoslavije, neki su od zapaženih primera (Orazem i Vodopivec 1995, 1997; Nesterova i Sabirianova 1999 i dr.). Takođe, ovom pitanju je posvećena velika pažnja i u ekonomijama razvijenih zemalja, naročito pri izučavanju odnosa koji ukazuju na to kako tržište rada vrednuje karakteristike pripadnika različitih demografskih grupa ili zaposlenih u javnom i privatnom sektoru (Swaffield 2000; Laroche i Mérette 2000; Disney 2007 i dr.), kao i kako se u preduzećima određuju zarade na različitim hijerarhijskim nivoima i kolika se pažnja posvećuje promociji i napredovanju (Grund 2005). Mincer-ova (1974: str. 9-23 i str. 83-89) funkcija zarada zasnovana na vrednovanju ljudskog kapitala može da se izvede u nekoliko koraka. Pođimo od pretpostavke da je zarada 0,iy koju dati pojedinac i, i=1,…,N, može da ostvari na tržištu tokom prve godine radnog iskustva, j=0, jednaka razlici između potencijalne zarade koju bi imao nakon završetka s godina formalnog obrazovanja i investicija uloženih u ljudski kapital, tj. 0,,0, isii Cyy  , pri čemu važi )( ,, sisi Ey  . 53 Takođe, pretpostavimo dalje da isti pojedinac nastavlja da investira u svoj razvoj, tokom perioda t-1, a nakon završetka formalnog obrazovanja, k -ti udeo svoje potencijalne zarade, koja će mu donositi 53 Prema izvornoj Mincer-ovoj terminologiji yi i Ei su neto (ili posmatrana) i bruto (ili potencijalna) zarada datog pojedinca i, respektivno. Pri tome, neto zarada predstavlja zaradu koja mu preostane kada se od bruto (ili potencijalne) zarade odbiju troškovi ulaganja, odnosno deo potencijalne zarade uložene u razvoj ljudskog kapitala nakon završetka formalnog obrazovanja. Analiza razlika u zaradama i višestrukog izbora zaposlenja 91 povraćaj uloženih investicija po stopi r , njegova potencijalna zarada u svakom narednom periodu, počevši od godine t(=1)+1, iznosila bi: )1( 111,2, krEE ii  , (4.1) pri čemu je 1,1,1 / ii ECk  , ili odnos između investicija i potencijalne zarade, koji Mincer (1974: str. 19) naziva “ekvivalentom za utrošeno vreme,” ili frakcijom vremena koje je utrošeno na razvijanje nečijeg ljudskog kapitala. Mincer je ovaj odnos uveo u sistem matematičkih formula iz praktičnih razloga, pre svega, zato što se u empirijskim studijama veoma retko raspolaže podacima o visini investicija uloženih u ljudski kapital izraženim u monetarnim jedinicama, te se umesto njih koristi broj godina radnog iskustva. Rekurzivno, ponavljajući istu operaciju za svaku godinu investiranja, izraz (4.1) postaje:     1 0 0,, )1( t j jjiti krEE , (4.2) što, zatim, u logaritamskoj formi postaje:     1 0 0,, )1ln(lnln t j jjiti krEE , (4.3) a zbog ln(1)=0 i pretpostavke da je ceo član jjjj krkr  )1ln( , kada je jr malo i ako je 1jk , gornji izraz se svodi na:     1 0 0,, lnln t j jjiti krEE . (4.4) Analiza razlika u zaradama i višestrukog izbora zaposlenja 92 Pošto je, kao što smo na početku pretpostavili, tisiti Cyy ,,,  , pri čemu važi da je ),( ,,, tisisi EEy  tokom posmatranog vremenskog perioda t, tiy , postaje )1(,,,, ttitittiti kEEkEy  , tako da se ceo izraz (4.4) svodi na: )1ln(lnln 1 0 0,, t t j jjiti kkrEy     . (4.5) Mincer (1974) uvodi i dodatne pretpostavke da bi se razlikovalo vreme ulaganja u ljudski kapital tokom formalnog obrazovanja od vremena ulaganja koje nastaje nakon završetka formalnog obrazovanja, a tokom kojeg, prema teoriji o optimalnoj alokaciji investicija u ljudski kapital (Ben-Porath 1967), investicije linearno opadaju: (i) 1tk tokom s godina školovanja, (ii) stopa prinosa rrj  je konstantna za sve nivoe uloženih investicija tokom perioda t, (iii)     1 0 t j jt kK je akumulirano vreme utrošeno u razvoj ljudskog kapitala nakon završetka formalnog obrazovanja, a pre isteka godine t. U narednom koraku imamo: )1ln(lnln 1 0 0,, t t j jpsiti kkrsrEy     , (4.6) odnosno, tpsiti KrsrEE  0,, lnln , (4.7) gde su, respektivno, sr i pr stope prinosa na ulaganje u formalno obrazovanje i na ulaganje u razvoj ljudskog kapitala nakon završetka formalnog obrazovanja, posmatrano u odnosu na potencijalne zarade. Poslednji član u izrazu (4.6) nestaje zbog uslova da je .1tk Analiza razlika u zaradama i višestrukog izbora zaposlenja 93 U cilju uspostavljanja matematičke relacije između potencijalnih zarada i radnog iskustva u funkciji zarada, Mincer (1974) je uveo četiri teorijska tipa investicionih profila vezano za ulaganje u ljudski kapital nakon završetka formalnog obrazovanja. Prva dva investiciona profila polaze od pretpostavke da ulaganje u ljudski kapital, izraženo u monetarnim jedinicama, opada linearno, odnosno eksponencijalno, kako se povećava broj godina radnog iskustva, a ovako specifikovanoj vezi između potencijalnih zarada i radnog iskustva odgovara aritmetička funkcija zarada. Druga dva investiciona profila se, s druge strane, zasnivaju na pretpostavkama da odnos između uloženih investicija i potencijalne zarade (ili, kao što je gore navedeno, “ekvivalent za utrošeno vreme”) opada linearno, odnosno eksponencijalno, čime funkcija zarada ima formu logaritamske funkcije. U empirijskim specifikacijama, najčešće se koristi logaritamska funkcija zarada, a najveću primenu je našao investicioni profil kojim se uvodi pretpostavka da se ulaganje u ljudski kapital linearno smanjuje tokom vremena. Stoga je odnos između uloženih investicija i potencijalne zarade, tk , kao što sledi: t T k kkt 0 0  , (4.8) gde je 0k odnos investicija i potencijalne zarade u prvoj godini radnog iskustva, j=0, a T je poslednja godina radnog iskustva ili ukupan period investiranja u kojem je vrednost investicija pozitivna. Logaritamska funkcija potencijalnih zarada, koju smo sveli na izraz (4.7), može da se prikaže na sledeći način:  t jjpsiti dkrsrEE 0 0,, lnln , (4.9) zbog uslova o monotonom opadanju ulaganja u ljudski kapital u periodu nakon završetka formalnog obrazovanja. Rešenjem integrala u izrazu (4.9): Analiza razlika u zaradama i višestrukog izbora zaposlenja 94 ) 2 ()()( 2000 0 0 0 0 0 0 t T k tkrt T k krdt T k krdkr p t p t jp t jjp   , (4.10) logaritamska funkcija potencijalnih zarada postaje: 20 00,, 2 lnln t T kr tkrsrEE p psiti  , (4.11) koja može da se transformiše u sledeći izraz: )1ln( 2 lnln 2 0 00,, t p psiti kt T kr tkrsrEy  , (4.12) gde je tiy ,ln logaritam posmatranih ili, prema Mincer-ovoj terminologiji, neto zarada koje smo dobili nakon odbitka troškova ulaganja, odnosno nakon odbitka dela potencijalne zarade koju bi dati pojedinac ostvarivao tokom perioda koji sledi posle završetka formalnog obrazovanja, tj. )1(,, ttiti kEy  . Zamenom izraza (4.8) u jednačinu (4.12) dobija se: )1ln( 2 lnln 00 20 00,, t T k kt T kr tkrsrEy p psiti  . (4.13) Pri svođenju izraza (4.13) na teorijsku funkciju zarada koja se koristi u empirijskom modeliranju, Mincer (1974) je koristio Tejlorov razvoj da bi dobio aproksimaciju drugog reda za poslednji član izraza koji ima oblik nelinearne funkcije (Dabčević et al. 1987). Primenom ove aproksimacije i reparametarizacijom članova jednačine dobija se standardni model koji može da se ocenjuje ekonometrijskim metodima: tititititi xxxy , 2 ,23,22,110,ln   , (4.14) Analiza razlika u zaradama i višestrukog izbora zaposlenja 95 gde su promenljive tiy , , tix ,1 , tix ,2 i 2 ,2 tix , redom, posmatrane zarade i-tog pojedinca u vremenskom periodu t, broj godina školovanja, broj godina radnog iskustva i broj godina radnog iskustva na kvadrat, dok je ti , slučajna greška za koju se pretpostavlja da je: ti , ~ N( 2,0  ). Parametri u jednačini (4.14) su definisani na sledeći način: ) 2 1(ln 000,0 k kEi  , sr1 , )1( 0 0 02 k T k krp  , 2 2 00 3 22 T k T krp  . Izraz (4.14) se naziva standardnom Mincer-ovom jednačinom zarada, čija raspodela se formira pod uticajem osnovnih komponenti ljudskog kapitala, a to su obrazovanje i radno iskustvo. 4.1.3 Proširena funkcija zarada U empirijskom modeliranju zarada u poglavlju 7 će se koristiti proširena funkcija zarada. Ova funkcija, pored determinanti koje objašnjavaju prinose na ljudski kapital, uključuje i druge objašnjavajuće faktore, kao što su npr. karakteristike radnog mesta, demografske karakteristike pojedinaca i faktori koji opisuju porodičnu situaciju, uključujući i izvore ukupnog dohotka, zatim geografski faktori i tome slično. Proširena funkcija zarada će se u nastavku izlaganja naizmenično nazivati funkcijom ili jednačinom zarada. Dodavanjem ovih objašnjavajućih promenljivih, označimo ih sa }{ ,tmix , m=1,…,M, i=1,…N, t=1,…,T, sa pripadajućim vektorom nepoznatih parametara m koji mere efekte tih promenljivih na zaradu, u izraz (4.14), dobija se sledeća jednačina: ti M m tmimtitititi xxxxy , 1 , 2 ,23,22,110,ln     . (4.15) Takođe, Mincer (1974) u svoj teorijski model nije uključio ni časove rada. Međutim, u empirijskom modeliranju funkcija zarada za potrebe analize koja će biti prikazana u poglavlju 7, umesto zarada u nominalnom izrazu će se koristiti stopa zarada, iskazana u prirodnim logaritmima, koja izražava odnos zarada i broja časova rada (bilo na osnovnom ili na dodatnom poslu). Analiza razlika u zaradama i višestrukog izbora zaposlenja 96 Na kraju ovog izlaganja o korišćenju determinanti ljudskog kapitala u objašnjenju kretanja zarada tokom životnog ciklusa, treba istaći da je Mincer-ov pristup, u skorije vreme, pobudio polemiku među ekonomistima o tome da li je standardna funkcija zarada i dalje robustna specifikacija, imajući u vidu da rezultati nekih skorašnjih empirijskih studija ukazuju na to da u novom ekonomskom okruženju standardna Mincer-ova jednačina ne može celovito da “uhvati” kretanje zarada datog pojedinca (Heckman et al. 2006; Lemieux 2006; Andini 2010). Tako, na primer, Heckman et al. (2006: str. 314) u svojoj analizi polaze od premise da “[Mincer-ov] model nije više validan vodič za precizno ocenjivanje stope prinosa na obrazovanje, ali da Mincer-ova vizija o korišćenju ekonomije u objašnjenju podataka o kretanju zaradama i dalje ostaje validna” [prevod autora]. Umesto da se logaritamska funkcija zarada posmatra kroz linearnu vezu sa brojem godina obrazovanja, Heckman et al. (2006) se zalažu za to da je ispravniji način dozvoliti nelinearnost ove veze kroz uključivanje nivoa obrazovanja u funkciju zarada. Na taj način, kao što Heckman et al. (2006) tvrde, može da se otkloni sumnja o interpretaciji ocenjenog koeficijenta uz godine obrazovanja kao o stopi prinosa na obrazovanje, umesto kao o stopi rasta zarada. Međutim, izvorna Mincer-ova funkcija zarada zasnovana na ulaganju u ljudski kapital se danas, u brojnim empirijskim studijama, koristi samo kao “model za poređenje” (en. benchmark model), budući da složenost odnosa u društvu, u ekonomiji ili u porodici, nalaže da se u modele kojima se objašnjava kretanje zarada uključuje veliki broj objašnjavajućih promenljivih koje nisu bile predviđene standardnom Mincer-ovom funkcijom zarada. Stoga će, umesto nje, proširena Mincer-ova funkcija zarada biti korišćena u modeliranju podataka o zaradama muškaraca i žena u Srbiji. 4.2 Modeli izbora dodatnog zaposlenja 4.2.1 Funkcija ponude dodatnog rada U dodatni rad se ubraja svaki rad koji se obavlja izvršavanjem različitih zadataka na poslovima izmeštenim sa osnovnog posla, gde se za ovaj potonji podrazumeva da je dati pojedinac zaključio ugovor o radu sa svojim poslodavcem i da prima zaradu, koju ćemo za potrebe izlaganja u ovom poglavlju nazvati osnovnom zaradom (ili zaradom od Analiza razlika u zaradama i višestrukog izbora zaposlenja 97 osnovnog posla). Analogno tome, zarada koju neko prima obavljajući jedan ili više dodatnih poslova se može nazvati dodatnom zaradom (ili zaradom od dodatnog posla). ‘Zakon o radu’ u Srbiji prepoznaje kategoriju dopunskog rada, koji se u smislu člana 202 ovog zakona definiše kao pravo zaposlenog sa punim radnim vremenom da “[…] može da zaključi ugovor o dopunskom radu sa drugim poslodavcem, a najviše do trećine punog radnog vremena” (Sl. gl. RS br. 24/05, 61/05, 54/09, 32/13 i 75/14). Budući da je dopunskim radom, kao što iz prethodne rečenice proizlazi, obuhvaćeno formalno angažovanje na dopunskim poslovima, u ovoj doktorskoj disertaciji ćemo umesto dopunskog koristiti dodatni rad kao širu kategoriju, pod kojom će se podrazumevati različite vrste formalnog i neformalnog rada, za čije obavljanje se isplaćuje adekvatna naknada (u novcu). Dakle, pojam dodatnog rada, usled različitih motiva kojima se rukovode oni koji se opredeljuju za izbor dodatnog zaposlenja, u ekonomskoj literaturi se različito tumači. Tako, Shishko i Rostker (1976: str. 298) navode da se “za pojedinca koji obavlja dva ili više poslova može reći da ‘mesečari’ ili da je uključen u sekundarno tržište rada” [prevod autora]. Teorijska objašnjenja o izboru dodatnog zaposlenja proizlaze iz (institucionalne) segmentiranosti tržišta rada na dva bazična sektora: osnovni ili primarni i sekundarni. Pri tome, ekonomisti su se prema ovoj podeli često odnosili i kritički, objašnjavajući svoja razmišljanja time da su se primarnom sektoru pripisivale odlike bolje plaćenih, dobrih i stabilnih poslova, za razliku od ponude poslova u sekundarnom sektoru koji su bili slabije plaćeni, lošiji i nestabilni, i prema tome, nisu adekvatno vrednovali karakteristike ljudskog kapitala, pa do toga da takva teorijska objašnjenja izlaze iz okvira standardnog neoklasičnog koncepta analize tržišta rada (Wachter et al. 1974). S druge strane, u post-socijalističkim zemljama osnovni motivi za izbor dodatnog posla se vezuju za “preživljavanje” tokom perioda ekonomske tranzicije, kada se zbog gašenja društvenih (ili državnih) preduzeća ili zbog izvesnosti gubitka posla, jedan broj radnika opredeljuje za dodatni posao, i to najčešće u neformalnom sektoru (Bedi 1998; Reilly i Krstić 2003). Da bismo objasnili funkciju ponude dodatnog rada (en. moonlighting supply function), pozovimo se ponovo na standardni koncept analize ponude rada koji se, korišćenjem matematičkih formula, može izraziti u formi neoklasičnog modela izbora između rada i dokolice (Borjas 2008). Prema teoriji racionalnog izbora, dati pojedinac Analiza razlika u zaradama i višestrukog izbora zaposlenja 98 nastoji da maksimizira svoju funkciju korisnosti (u), koja se, u opštem slučaju, sastoji od potrošnje dokolice (l) i potrošnje opšteg skupa dobara (c), birajući između povećanja potrošnje jedne i smanjenja potrošnje druge grupe dobara. To nas dovodi do marginalne stope supstitucije (mrs) koja pokazuje za koliko jedinica korisnosti dati pojedinac želi da se uzdrži od potrošnje dokolice u zamenu za dodatnom potrošnjom opšteg skupa dobara, tj. m c m l u u mrs  , gde su mlu i m cu marginalna korisnost dokolice i marginalna korisnost potrošnje opšteg skupa dobara, respektivno. Ukoliko se dalje pretpostavi da je stopa po kojoj se vrši supstitucija dokolice potrošnjom opšteg skupa dobara jednaka stopi zarade, tada se marginalna stopa supstitucije može izraziti sledećim odnosom: m c m l u u y  , gde je y stopa zarada. Naslanjajući se na teorijska objašnjena koja su izložena u prethodnom pasusu, Shishko i Rostker (1976) izvode funkciju ponude dodatnog rada iz uslova da je ukupan broj časova rada na osnovnom poslu ograničen. To dalje implicira da pojedinac koji želi da radi više časova na osnovnom poslu, tj. 0'  mm hh , pri čemu je ' mh željeni a mh stvarni broj časova rada, ali mu to nije omogućeno zbog uslova da je mm hh  ' , bira dodatni posao da bi ostvario svoje ciljeve koji proizlaze iz želje za većom potrošnjom (i većim dohotkom). Drugim rečima, dati pojedinac će prihvatiti dodatni posao, ukoliko mu taj posao donosi zaradu (označimo je sa sy ) koja prevazilazi marginalnu stopu supstitucije između dohotka i dokolice, tj. ukoliko stopa zarada koju ostvaruje na dodatnom poslu prevazilazi stopu rezervacione zarade (označimo je sa rsy ) ili minimalno prihvatljive zarade. Odnos između stope zarade na osnovnom poslu (označimo je sa my ) i dodatnom poslu može da utiče na varijacije u željenom broju časova rada. Pri tome, razlikuju se tri situacije u kojima može da se nađe dati pojedinac. Ukoliko mu je ponuđena zarada na dodatom poslu koja je manja od zarade na osnovnom poslu, prihvatanjem dodatnog posla, dati pojedinac se opredeljuje za to da ukupno radi nekoliko časova manje od željenog broja časova rada na osnovnom poslu. Zatim, ukoliko mu je ponuđena zarada na dodatom poslu koja je veća od zarade na osnovnom poslu, njegov izbor u pogledu ukupnog broja časova rada može da bude i veći od inicijalno željenog broja časova rada Analiza razlika u zaradama i višestrukog izbora zaposlenja 99 na osnovnom poslu. I, na kraju, ukoliko nema ograničenja u pogledu broja časova rada koje je dati pojedinac spreman da provede na dodatnom poslu, njegov izbor ga može dovesti do toga da osnovni posao zameni dodatnim poslom. O ovom poslednjem izboru će biti više reči u narednoj tački. Štaviše, zavisnosti između osnovne zarade i broja časova rada na osnovnom poslu, s jedne strane, i dodatne zarade i broja časova rada na dodatnom poslu, s druge strane, mogu da se izraze sledećim skupom relacija, pod uslovom da je dokolica superiorno dobro 54 (Shishko i Rostker 1976): (i) ako važi da je sm yy  , tada će se ponuda broja časova rada na dodatnom poslu, sh , nedvosmisleno smanjiti bez obzira na broj časova rada, mh , koje je moguće ostvariti na osnovnom poslu; (ii) ako važi da je sm yy  , tada će se ponuda broja časova rada na dodatnom poslu, sh , smanjiti za isto toliko za koliko će se povećati broj časova rada na osnovnom poslu, mh ; (iii) ako važi da je sm yy  , tada će povećanje broja časova rada na osnovnom poslu, mh , dovesti do povećanja ponuđenog broja časova rada na dodatnom poslu, sh . Funkciju ponude dodatnog rada, Shishko i Rostker (1976) izvode pod pretpostavkom da ukupan broj časova rada na dodatnom poslu, sh , zavisi od zarade koju je moguće ostvariti na tom poslu, sy , a na čiju visinu dati pojedinac ne može da utiče. Međutim, racionalni pojedinac nastoji da maksimizira svoju funkciju korisnosti u, ),(max.)|( lcuys  , u odnosu na dati skup uslova: 00  chyhya ssmm , (4.16a) 0 lhhH sm , (4.16b) 0,, shlc . (4.16c) U (4.16a) do (4.16c), l i c, predstavljaju dokolicu i potrošnju opšteg skupa dobara, kao što smo već prethodno naveli, 0a je neradni dohodak, a je H ukupan (fiksan) broj 54 Za neko dobro se kaže da je superiorno dobro ukoliko sa porastom dohotka, zadržavajući cene ostalih dobara u korpi konstantnim, raste potrošnja tog dobra. Analiza razlika u zaradama i višestrukog izbora zaposlenja 100 časova koji je datom pojedincu na raspolaganju za rad ili za dokolicu, u jednostavnom slučaju izbora koji ovde posmatramo. Ukoliko se sh izluči iz izraza (4.16b), te se potom zameni u (4.16a) i definiše nova jednačina, koju ćemo označiti sa mY , dobija se sledeća funkcija ponude dodatnog rada: 55 m s ms Y y hHh      , (4.19) čiju supstituciju, možemo ponovo da izvršimo u izraz (4.16b), zbog rešenja datog u (4.18) ispod. U narednom koraku, funkcija ponude dodatnog rada, definiše se iz ekonomskog uslova, prema kojem važi da je ponuda dodatnog rada komplementarna potražnji za dokolicom, usled negativnog predznaka uz l. Da bi se izvele osobine funkcije ponude dodatnog rada, Shishko i Rostker (1976), skupu uslova koje smo definisali izrazima od (4.16a) do (4.16c), dodaju i sledeći uslov: 0 scl yuu , (4.16d) 55 Ukoliko u izrazu (4.16a), sh zamenimo sa )( lhHh ms  , koje smo izlučili iz izraza (4.16b), dobija se 0)(0  clhHyhya msmm . Nakon uvođenja nove promenljive mY , koja apsorbuje sve članove proširenog izraza, izuzev l i c, izraz (4.16a) postaje: 0 clyY sm , 0, lc , (4.17) u odnosu na koji se maksimizira pojednostavljena funkcija korisnosti, u(c,l), koju Shishko i Rostker (1976: str. 300) nazivaju indirektnom funkcijom korisnosti  , a čiji su prvi izvodi po sy i mY jednaki l i  , pri čemu je  konstanta. Funkcija ponude dodatnog rada se, zatim, može izraziti na sledeći način: lhH l hHh mms    . (4.18) Analiza razlika u zaradama i višestrukog izbora zaposlenja 101 s tim da rešenje datog sistema jednačina podrazumeva da na desnoj strani izraza važi znak jednakosti sa nulom. Sistem jednačina koji čine (4.16a), (4.16b) i (4.16d) se sada rešava primenom diferencijalnog računa i izražava se u matričnoj formi:56                                     sc m ssmmmms clccsllcls s dyu dh dyhdyhdhyda dc dl dh uuyuuy y )( )()(0 011 10 0 . (4.20) Uslov drugog reda u ravnoteži obezbeđuje da je matrica, označimo je sa A, pozitivno definitna (Dabčević et al. 1987). Granični Hesijan, * , za funkciju korisnosti, u, se dobija izračunavanjem determinante matrice A, odnosno množenjem njenih kofaktora elementima prvog reda, odakle sledi: 57 0/)()( 2*  cllclsclccss uuuyuuyyA . (4.23) Prvi izvod funkcije ponude dodatnog rada, koju smo izrazili brojem časova rada, sh , u odnosu na zaradu, sy , koju je moguće ostvariti na dodatnom poslu, daje sledeći rezultat: 56 Za funkciju korisnosti se pretpostavlja da ima dva neprekidna izvoda (Dabčević et al. 1987). Oznake ccu i llu označavaju parcijalne izvode funkcije drugog reda, a clu mešoviti parcijalni izvod, za koji, zbog Švarcove teoreme, važi da je lccl uu  . Bliže, parcijalni izvodi po dl i dc u (4.20), mogu da se prikažu na sledeći način: clslll uyud  , odakle proizlazi da je 0 llcls uuy , odnosno ccsclc uyud  , što daje 0 clccs uuy . 57 Prvi kofaktor, označimo ga sa 11A , matrice A je: )( )()( 01 )1( 211 clccs clccsllcls uuy uuyuuy A     , (4.21) te se, analogno tome, mogu izračunati i preostala dva kofaktora, 12A i 13A . Time se dobija determinanta matrice A, kao što sledi:  ))(1()(0)( llclsclccsclccss uuyuuyuuyyA (4.22) )()( llclsclccss uuyuuyy  Analiza razlika u zaradama i višestrukog izbora zaposlenja 102          A A h A u y h s c s s 11 , (4.24) koji predstavlja jednačinu Hiks-Sluckog (Shishko i Rostker 1976). Interpretacija članova na desnoj strani izraza (4.24) nam ukazuje na smer ekonomske zavisnosti promenljivih veličina. Tako pozitivna vrednost predznaka od A uc znači da kada se povećava oportunitetni trošak odustajanja od dodatnog posla, povećava se i broj ponuđenih časova rada. Drugi član izraza (4.24) predstavlja efekat dohotka,       A A11 , koji nam ukazuje na to da je vrednost ovog člana pozitivna, kada je dokolica superiorno dobro, kao što smo na početku i pretpostavili, tako da predznak desne strane izraza (4.24) postaje dvosmislen. To u suštini znači da sa povećanjem stope zarada na dodatnom poslu, izbor datog pojedinca može da bude da radi manje ili da radi više časova. Samo kada je dokolica inferiorno dobro, tj. kada porast dohotka deluje na smanjenje vremena predviđenog za dokolicu, član       A A11 je negativan, tako da oba efekta, i efekat dohotka i efekat supstitucije, deluju u istom pravcu (Shishko i Rostker 1976). Na sličan način se dobijaju efekti promena u broju časova rada na dodatnom poslu u odnosu na promene u ostalim elementima funkcije ponude dodatnog rada (Shishko i Rostker 1976). Stoga, dalje, prvi izvod funkcije ponude dodatnog rada u odnosu na stopu zarade na osnovnom poslu daje:          A A h y h m m s 11 , (4.25) što ukazuje na negativnu vezu između ovih dveju veličina. Promena u broju časova rada na osnovnom poslu, odražava se na promenu broja časova rada na dodatnom poslu, kao što sledi na osnovu prvog izvoda funkcije ponude dodatnog rada u odnosu na broj časova rada na osnovnom poslu: Analiza razlika u zaradama i višestrukog izbora zaposlenja 103 )(1 11 ms m s yy A A h h          , (4.26) a interpretaciju zavisnosti između ovih veličina smo već objasnili na početku ove tačke. Preostali član u funkciji ponude dodatnog rada, čiji efekat promene na broj časova rada na dodatnom poslu može da se iskaže sledećim izrazom:          A A a hs 11 0 , (4.27) nedvosmisleno pokazuje da povećanje neradnog dohotka utiče na smanjenje ponude dodatnog rada. U empirijsko modeliranje izbora dodatnog posla, pored merenja efekata koji su predviđeni teorijskim modelom ponude dodatnog rada, a koje smo izrazili sa (4.24) do (4.27), uključuje se i merenje efekata drugih promenljivih veličina za koje se očekuje da mogu imati uticaj na broj časova rada na dodatnom poslu, kao što ćemo videti u poglavlju 7. 4.2.2 Dinamički model ponude dodatnog rada Standardni model ponude dodatnog rada se zasniva na ključnoj pretpostavci da je ukupan broj časova rada na osnovnom poslu ograničen, te se, usled toga što mu nije data mogućnost da radi više časova na osnovnom poslu, dati pojedinac opredeljuje za dodatni posao koji mu donosi zaradu veću od rezervacione zarade, ali očekivano nižu58 od zarade koju bi dobijao za uvećan broj časova rada na osnovnom poslu (Shishko i Rostker 1976). Pretpostavke na kojima je razvijen ovaj model, uticale su na to da se može nazvati i statičkim modelom ponude dodatnog rada, a izložili smo ga u prethodnoj tački. Paxson i Sicherman (1996), s druge strane, model izbora dodanog posla posmatraju u kontekstu mobilnosti na osnovnom poslu i/ili prelaza sa jednog na drugi osnovni posao, čime ključna pretpostavka o ograničenom ukupnom broju časova koje 58 Ova teorijska pretpostavka često nije potvrđena u empirijskim studijama, naročito ukoliko pojedinci sa visokim obrazovanjem obavljaju dodatne poslove u istoj struci kako u razvijenim zemljama (Paxson i Sicherman 1996) tako i u zemljama u tranziciji (Foley 1997). Analiza razlika u zaradama i višestrukog izbora zaposlenja 104 dati pojedinac može da radi na osnovnom poslu više nije restriktivna. Svoj teorijski pristup o razvijanju modela izbora dodatnog posla, ovi autori zasnivaju na pretpostavci, da tokom životnog ciklusa, dati pojedinac može da menja svoje odluke vezano za izbor dodatnog posla, tako da broj časova rada na dodatnom poslu može da zavisi, između ostalog, i od načina na koji deluju faktori koji određuju odnos između dokolice i potrošnje opšteg skupa dobara. Njegove odluke mogu da utiču na to da izabere dodatni posao, ali, isto tako, i da odustane od dodatnog posla, vodeći se različitim motivima, tako da izbor dodatnog posla postaje dinamičan proces. Međutim, ograničenje, koje često ne omogućava da se studije izbora dodatnog posla tokom životnog ciklusa datog pojedinca i sprovedu, javlja se u vidu nedostatka longitudinalnih podataka panela koji su potrebni za takve vrste studija. Dakle, razvijanje dinamičkog modela izbora dodatnog posla je, pre svega, bilo inspirisano rezultatima empirijskih studija. K tome, motivi izbora dodatnog posla mogu da budu višestruki. Tako, na primer, Paxson i Sicherman (1996) navode, da pored ograničenog broja časova rada na osnovnom poslu, skup razloga koji dovode do toga da se neko opredeli za izbor dodatnog posla, može da se grupiše u najmanje tri grupe: (i) osnovni i dodatni posao se međusobno nadopunjuju, pri čemu prvi obezbeđuje siguran izvor dohotka od rada, a drugi stručnu obuku, poslovne kontakte ili druge vrste profesionalnog zadovoljstva; (ii) osnovni posao može da osigura sigurnu zaradu, i, prema tome, siguran izvor dohotka od rada, ali osnovna zarada može da bude i niža od dodatne zarade koja je često volatilnija; (iii) dodatni posao može da pomogne pri sticanju potrebnog radnog iskustva, naročito ukoliko neko želi da se oproba u poslu za koji je potrebno zanimanje drugačije od onog na osnovnom poslu. Ovom skupu razloga, treba dodati i razloge koji se javljaju na tržištima rada za koja je karakterističan visok stepen segmentiranosti, kakva su tržišta rada zemalja u tranziciji. Ponašanje onih koji se opredeljuju za dodatni posao u neformalnom sektoru se često objašnjava mehanizmima preživljavanja u uslovima niskih i neredovnih zarada i nedovoljne zaposlenosti na osnovom poslu (Bedi 1998; Reilly i Krstić 2003). Osnovne razloge za razvijanje teorijskog modela izbora dodatnog posla u dinamičkom kontekstu, Paxson i Sicherman (1996) nalaze u tome što standardni model izbora Analiza razlika u zaradama i višestrukog izbora zaposlenja 105 dodatnog posla (Shishko i Rostker 1976), s jedne strane, ne može da objasni zašto neko radi na osnovnom poslu na kojem mu nije omogućeno da radi željeni broj časova, i što, s druge strane, takav model ne može da objasni zašto dati pojedinac ne promeni osnovni posao da bi izbegao ograničenje koje mu je nametnuto u vidu maksimalnog broja časova rada, umesto što se opredeljuje za dodatni posao. U specifikovanju teorijskog modela, Paxson i Sicherman (1996) polaze od sledećeg skupa polaznih pretpostavki:59 (i) ukupan broj časova rada nije stohastička promenljiva, već fiksna veličina; (ii) dati pojedinac se ne izlaže nikakvim troškovima da bi dobio dodatni posao, što znači da dati pojedinac može lako da ostvari tranziciju sa jednog na drugi dodatni posao, iako su ukupni časovi rada dati kao fiksna veličina, ukoliko se rukovodi svojim preferencijama od kojih svaka predstavlja različit broj časova rada na različitim dodatnim poslovima; (iii) sm yy  , kao ključna pretpostavka bez koje bi dati pojedinac uvek preferirao da dodatni posao uzme kao novi osnovni posao, tj. bez ove pretpostavke uslov o ograničenom ukupnom broju časova rada na osnovnom poslu je ništavan.60 Polazeći od skupa polaznih pretpostavki, Paxson i Sicherman (1996) predstavljaju sledeću funkciju korisnosti, tu , koju dati pojedinac maksimizira da bi ostvario željeni broj časova rada na dodatnom poslu, u svakom trenutku t: 2)( stmttstsmtmt hhhyhyu   . (4.28) U izrazu (4.28) t meri efekte skupa slučajnih promenljivih, koje predstavljaju faktore na strani ponude rada, označimo ih sa  tx , t=1,…,T, na marginalnu korisnost broja časova rada u svakom vremenskom periodu t (Paxson i Sicherman 1996). Da bi ostvario željeni broj časova rada na dodatnom poslu, dati pojedinac maksimizira svoju funkciju korisnosti, u svakom trenutku t, tako da se željeni broj časova rada, označimo ga sa *sth , može izraziti sledećom funkcijom: 59 Takođe, Shishko i Rostker (1976) koriste sličan skup polaznih pretpostavki pri razvijanju svog modela izbora dodatnog posla. 60 Videti fusnotu 58. Analiza razlika u zaradama i višestrukog izbora zaposlenja 106 )0,max( ** mtmt m s st hh y y h  , (4.29) gde je *mth željeni broj časova rada na osnovnom poslu koji je takođe rezultat maksimizacije funkcije korisnosti u odnosu na dati skup uslova, a mth je stvarni (ili posmatrani) broj časova rada na osnovnom poslu, dok je m s y y  , za koje važi da je 1 , kao što je dato u skupu polaznih pretpostavki. Dati pojedinac će prihvatiti dodatni posao, u vremenskom periodu t, samo ako je količnik stvarnog i željenog broja časova rada na osnovnom poslu, označimo ga sa t , manji od  . Rešenje funkcije maksimizacije (4.29) rezultira sa tri moguća izbora (Paxson i Sicherman 1996). Prvi slučaj podrazumeva da je 321 ttt   , što znači da dati pojedinac nikad neće izabrati dodatni posao. Drugi slučaj podrazumeva da važi odnos 321 ttt   , tako da će dati pojedinac prihvatiti dodatni posao samo ako je   tt1 . Treći slučaj, 321 ttt   , datom pojedincu ostavlja najveći izbor, tj. ukoliko je dati pojedinac prešao sa jednog na drugi osnovni posao, istovremeno može da se opredeli i za dodatni posao, čak ako ga nije ni imao pre promene osnovnog posla. U tri izložena slučaja važi da je 321 ttt   , pri čemu, ova tri parametra predstavljaju, redom, minimalno prihvatljiv odnos između stvarnog i željenog broja časova rada ( 1t ), odnos koji važi u slučaju napuštanja prethodnog i prelaza na novi osnovni posao ( 2t ), i za datog pojedinca maksimalno prihvatljiv odnos između stvarnog i željenog broja časova rada ( 3t ). Analiza razlika u zaradama i višestrukog izbora zaposlenja 107 5. STATISTIČKI METODI MERENJA RAZLIKA U ZARADAMA Razvijanje statističkih metoda merenja razlika u zaradama je bilo motivisano spoznajom da su pripadnici različitih demografskih grupa, čak i sa istim prosečnim karakteristikama, kao što su obrazovanje, radno iskustvo, zanimanje, zaposlenost u datom ekonomskom sektoru i sl., bili različito plaćeni za obavljanje istog posla, i to u zavisnosti od rodne, rasne, ili etničke pripadnosti, kao i pripadnosti određenim grupama migranata i drugim manjinskim grupama u društvu. Prve studije o razlikama u zaradama su nastale u SAD-u i merile su razlike u zaradama prema rasnoj pripadnosti između belaca i Afroamerikanaca, a teorijsko uporište ovih studija se nalazilo u Becker-ovoj teoriji o ekonomiji diskriminacije koja je objavljena 1957. godine u knjizi pod istoimenim naslovom na engleskom jeziku ‘The Economics of Discrimination’ (videti npr. Becker 1982; Borjas 2008). Becker-ova teorija je otvorila put razvoju koncepta diskriminacije koji počiva na različitim ukusima ili predubeđenjima (en. taste discrimination), a meri se tzv. koeficijentom diskriminacije. Preciznije, Becker je izvorno ovaj koeficijent nazvao koeficijentom tržišne diskriminacije (en. market discrimination coefficient) koji predstavlja procentualnu razliku u zaradama između dve vrste rada koji su perfektni substituti. 61 U koeficijentu diskriminacije je sadržana količina “predubeđenja,” a kao izvori diskriminacije posmatrali su se poslodavci (kroz odnos prema pripadnicima različitih polova, rasa i sl.), zaposleni (kroz odnos prema kolegama) ili potrošači (kroz ponašanje prema pripadnicima različitih demografskih grupa koji im pružaju određene usluge). Osim ovog koncepta diskriminacije, istovremeno se razvijao i koncept statističke diskriminacije (en. statistical discrimination). Ovaj oblik diskriminacije podrazumeva da se poslodavac, u svom odnosu prema stvaranju profita kompanije, rukovodi time da o pripadnicima određene demografske grupe, na primer, posmatrano prema polu ili godinama starosti, donosi 61 Jednim od začetnika daljeg teorijskog razvoja ovog koncepta i njegovog prilagođavanja potrebama empirijskih studija smatra se Ronald Oaxaca nakon objavljivanja svog rada 1973. godine. Oaxaca (1973) je svoj statistički koncept merenja razlika u zaradama muškaraca i žena zasnovao na definisanju koeficijenta diskriminacije koji predstavlja odnos između Becker-ove uopštene mere diskriminacije i odnosa zarada koju bi ove dve demografske grupe primile da nema diskriminacije. Dakle, koeficijent diskriminacije, na način kako ga definiše Oaxaca, izražava odnos sledećih veličina: oF i M i oF i M i sF i M ic yyyyyyd )//(])/()/[(  , gde eksponenti s i o označavaju odnose stvarnih zarada i zarada između muškaraca i žena u odsustvu diskriminacije, respektivno. O metodu razlaganja zarada koji je predložio Oaxaca i drugi autori će biti više reči u nastavku ovog poglavlja. Analiza razlika u zaradama i višestrukog izbora zaposlenja 108 odluke na osnovu statističkih podataka koji sa određenim nivoom pouzdanosti mogu da predvide verovatnoće ponašanja pojedinaca kroz njihov doprinos produktivnosti kompanije. Dakle, ukoliko se radi o, na primer, izboru između zapošljavanja muškaraca i žena, poslodavac upada u zamku statističke diskriminacije, zbog toga što smatra da informacije, koje kandidati objavljuju u svojim biografijama ili odgovori koje daju prilikom razgovora za posao, ne odražavaju precizne podatke na osnovu kojih se može pouzdano predvideti njihova produktivnost. Izvor statističkih podataka o ponašanju zaposlenih, koje poslodavac konsultuje pri donošenju konačne odluke, može da bude registar lica koja su bila ili su trenutno zaposlena u kompaniji ili rezultati srodnih empirijskih studija. Ovi podaci mogu da ukažu na to koliko se u proseku zaposleni zadržavaju u kompaniji nakon što dostignu određeni nivo karijernog napredovanja koji je praćen ulaganjem kompanije u specijalističke obuke zaposlenih ili kolika je verovatnoća da će mlade žene odsustvovati sa posla ili prekinuti karijeru zbog formiranja porodice i sl. Prema ovom konceptu, pripadnici demografskih grupa koje imaju visoku prosečnu produktivnost imaju i veću ekonomsku korist od pripadnosti toj grupi, u odnosu na one koji pripadaju grupi sa niskom prosečnom produktivnošću (Borjas 2008). Posledično, pripadnici prve grupe su inicijalno izloženiji manjoj statističkoj diskriminaciji, u odnosu na pripadnike druge grupe. Standardni obrasci ponašanja pokazuju da je, kada je reč o analizi razlika u zaradama i ispitivanju potencijalnog uticaja diskriminacije na određivanje nivoa zarada, grupa sa manjim procentualnim učešćem u određenoj skupini više izložena diskriminaciji u odnosu na grupu sa većim učešćem. Ukoliko se posmatraju relativni odnosi između žena i muškaraca na tržištu rada, na osnovu statističkih podataka se može zaključiti da su žene ekonomski manje aktivne u ukupnoj radnoj snazi i da imaju niže stope zaposlenosti u odnosu na muškarce. Manjinski udeo u ekonomski aktivnoj radnoj snazi i tradicionalno različite uloge u društvu doprineli su tome da se žene hipotetički posmatraju kao skupina koja je izloženija diskriminaciji, tj. da je struktura zarada muškaraca bliska stvarnoj strukturi koja odražava način ekonomskog vrednovanja pojedinaca u odsustvu diskriminacije. Pod pretpostavkom da je visina zarada u modelima objašnjena što je moguće većim brojem posmatranih, obuhvaćenih ili merljivih faktora, na razlici, između onoga što bi žene zarađivale u proseku da su Analiza razlika u zaradama i višestrukog izbora zaposlenja 109 njihove osobine vrednovane jednako kao i karakteristike muškaraca i onoga što stvarno zarađuju, formira se neobjašnjeni deo ukupne razlike u zaradama, koji uključuje i neopažene karakteristike i uticaj diskriminacije zbog diskriminatornog ponašanja prema određenoj grupi učesnika na tržišta rada. Na ovim postavkama su razvijeni prvi metodi merenja razlika u zaradama (Blinder 1973; Oaxaca 1973). Zahvaljujući boljem vrednovanja znanja i veština na tržištu rada, jaz u zaradama muškaraca i žena se smanjuje, usled sve boljih kvalifikacija ženske radne snage, ali se, istovremeno, dešavaju i značajne promene kroz raspodele zarada muškaraca i žena ponaosob. U razvijenim industrijskim zemljama, tokom osamdesetih i devedesetih godina prošlog veka, došlo je do značajnog povećanja nejednakosti u zaradama muškaraca i žena, i to usled ekonomski vođenih faktora, kao što su tehnološke promene, porast međunarodne razmene, smanjenje značaja sindikata i sl. (Blau i Kahn 2000). Analizirajući strukturu zarada muškaraca u SAD-u i poredeći je sa strukturom zarada u izabranim razvijenim zemljama, Blau i Kahn (1996) zaključuju da je više vrednovanje znanja i veština traženih na tržištu rada SAD-a dovelo do porasta nejednakosti u zaradama muškaraca. Proširujući svoju analizu na poređenje razvijenih industrijskih zemalja, Blau i Kahn (2003) dolaze do veoma značajnog zaključka koji se tiče, s jedne strane, trenda smanjena jaza između prosečnih zarada muškaraca i žena, i s druge strane, povećanja nejednakosti u zaradama. Naime, sprovodeći empirijsku analizu nejednakosti u zaradama na uzorku razvijenih zemalja, ovi autori zaključuju da se institucije tržišta rada ubrajaju među glavne objašnjavajuće faktore koji dovode do ujednačenije strukture pojedinačnih zarada i time do smanjenja razlika u zaradama muškaraca i žena. Istovremeno je i neobjašnjeni deo razlike u zaradama muškaraca i žena doprineo opadajućoj tendenciji ukupnog jaza u zaradama. Empirijske studije nude nekoliko objašnjenja koja su sažeta u radovima Blau-a i Kahn-a (2000, 2007). Jedno od objašnjenja se zasniva na nalazu da su žene, paralelno sa poboljšanjem relativnog nivoa posmatranih karakteristika, kao što su nivo obrazovanja i broj godina radnog iskustva (O'Neill i Polachek 1993), unapredile i neopažene individualne karakteristike (Blau i Kahn 2007). Ova tvrdnja se zasniva na činjenici da je više verovatno da modelima zarada nisu u dovoljnoj meri obuhvaćene investicije u unapređenje ličnih kvalifikacija i Analiza razlika u zaradama i višestrukog izbora zaposlenja 110 veština, tj. da su zbog manjkavosti raspoloživih podataka, izostavljene relevantne objašnjavajuće promenljive koje mere ulaganje u lični razvoj tokom radnog veka, nego da je smanjen deo diskriminacije koji ima svoje ishodište u različitim predubeđenjima poslodavaca o zaposlenim muškarcima i ženama. Međutim, sa unapređenjem kako posmatranih tako i neopaženih individualnih karakteristika ženske radne snage, smanjuje se prostor za prisustvo statističke diskriminacije, a kao posledica toga poslodavci postaju skloniji ka tome da više vrednuju karakteristike zaposlenih žena, što doprinosi porastu njihovih zarada. Iz navedenog proizlazi da, do nivoa, do kojeg efekti unapređenih ličnih kvalifikacija i veština žena nisu mereni u jednačinama zarada žena na bazi kojih se razlažu rodne razlike, može da se objasni smanjenje neobjašnjenog dela ukupnog jaza. Takođe, deo neobjašnjene razlike u zaradama, za koju se veruje da je rezultat direktne diskriminacije žena na tržištu rada, smanjuje se i zbog samih promena u stavovima društva prema diskriminaciji kao neprihvatljivoj društvenoj pojavi, ali i zbog zakonodavnih aktivnosti u većini zemalja sveta koje su usmerene na donošenje antidiskriminacijskih propisa. Ove aktivnosti su naročito svojstvene zemljama članicama Evropske unije, kao i onima koje idu u pravcu evropskih integracija, uključujući i Srbiju, a ostvaruju se kroz realizaciju pretpristupnog poglavlja o socijalnoj politici i zapošljavanju.62 Važan doprinos razumevanju kretanja jaza u prosečnim zaradama muškaraca i žena, u SAD-u, dali su O'Neill i Polachek (1993). Međutim, zaključci analize koju su prezentovali ovi autori mogu da se uopšte i da pomognu u razumevanju opšteg trenda u kretanju razlika u zaradama muškaraca i žena u svetu. Na približavanje ili konvergenciju, tj. na ograničavanje raspona u prosečnim zaradama muškaraca i žena, tokom druge polovine prošlog veka, najviše su uticali priliv obrazovane ženske radne snage na tržište rada i porast broja godina radnog iskustva žena. Osim ovih individualnih karakteristika, relativni položaj žena je poboljšan i zahvaljujući strukturnim promenama, budući da je veći procenat žena sa određenim zanimanjima bio zaposlen u onim ekonomskim sektorima koji su bili pod povoljnim uticajem strukturnih 62 Pitanje rodne perspektive i zabrane diskriminacije deo je osnivačkog akta Evropske ekonomske zajednice – ‘The Treaty establishing the European Economic Community’ ili ‘The Treaty of Rome’ – koji datira iz 1957. godine. Kasnije je usledilo donošenje brojnih direktiva koje čine deo EU acquis o rodnoj ravnopravnosti (videti npr. OJ L45, 1975/117/EEC; OJ L204, 2006/54/EC). Analiza razlika u zaradama i višestrukog izbora zaposlenja 111 promena. Dok su, s jedne strane, povećavane premije na zarade zaposlenih sa višim nivoima obrazovanja, dotle su, s druge strane, smanjivane premije na zarade radnika sa nižim nivoima obrazovanja. Prosečne zarade muškaraca sa nižim nivoima obrazovanja su bile više izložene uticaju negativnih efekata strukturnih promena, budući da su muškarci procentualno više zastupljeni u grupi nisko kvalifikovane radne snage. Ali, isto tako, porast premija na zarade visoko kvalifikovane radne snage, koju čine zanimanja u kojima su pretežno zastupljeni muškarci, služio je kao faktor koji je uticao na širenje jaza, te se usporavala dinamika sužavanja ukupnog jaza. U ovom poglavlju doktorske disertacije će biti objašnjeno nekoliko naučnih metoda na kojima se zasnivaju empirijske studije dekompozicije razlika u zaradama muškaraca i žena. 5.1 Standardni metodi dekompozicije razlika u zaradama Blinder-a i Oaxaca-e 5.1.1 Metodi dekompozicije razlika u zaradama Standardni metod dekompozicije razlika u srednjim vrednostima zarada dveju demografskih grupa, npr. muškaraca i žena, zasniva se na teorijskim postavkama Blinder-a i Oaxaca-e koje su ovi autori objavili u dva nezavisna rada početkom 1970-ih godina (Blinder 1973; Oaxaca 1973). Osnovu za primenu metoda kojim se razlažu razlike u zaradama muškaraca i žena, ovi autori nalaze u ocenjivanju jednačine zarada Mincer-ovog tipa 63 (videti tačku 4.1.2) i svojstva da je očekivana vrednost slučajne greške u modelu zarada jednaka nula, tj. E ( i )=0, što implicira sledeći izraz za očekivanu vrednost zavisne promenljive iy : )'()( ii xEyE  , i=1,2,..,N. (5.1) 63 Za razliku od Mincer-ove linearne jednačine zarada, Fortin i Lemieux (1998) u analizu uvode regresije rangova i modeliraju funkcije zarada na način da je pozicija (ili rang) radnika u raspodeli zarada određena njihovim karakteristikama (koje čine obrazovanje i radno iskustvo), tako da su svi radnici sa sličnim karakteristikama pod podjednakim uticajem promena u strukturi zarada. Analiza razlika u zaradama i višestrukog izbora zaposlenja 112 Standardna metoda dekompozicije Blinder-Oaxaca-e se zasniva na ocenjivanju dve odvojene jednačine zarada: M i K k M ik M k MM i xy    1 0)ln( , i=1,2,..,N, k=1,...,K, (5.2a) F i K k F ik F k FF i xy    1 0)ln( , i=1,2,..,N, k=1,...,K, (5.2b) gde su Miy i F iy zarade muškaraca (nadalje označene sa M u eksponentu) i žena (označene sa F u eksponentu), respektivno, merene prema radnom času i izražene u logaritmima, M0 i F 0 su slobodni članovi, a M ikx i F ikx su objašnjavajuće promenljive sa pripadajućim skupom nepoznatih parametara Mk i F k , dok su M i i F i slučajne greške. Primena metoda ocenjivanja OLS koji podrazumeva normalnu raspodelu slučajnih grešaka sa sredinom jednakom nula omogućava da se sistem jednačina (5.2a) i (5.2b) izrazi u srednjim vrednostima slučajnih promenljivih:    K k M k M k MM xy 1 0 ˆˆ)ˆln(  , k=1,...,K, (5.3a)    K k F k F k FF xy 1 0 ˆˆ)ˆln(  , k=1,...,K. (5.3b) Razlika između predviđene vrednosti zarada muškaraca i predviđene vrednosti zarada žena sada se dobija oduzimanjem jednačine (5.3b) od (5.3a), što se u smislu metoda dekompozicije Blinder-Oaxaca-e svodi na sledeći izraz:      K k K k FMF k M k F k F k M k M k FM xxxyy 1 1 00 ) ˆˆ()ˆˆ()(ˆ)ˆln()ˆln(  , k=1,..,K. (5.4) U gornjem izrazu, Myˆ i Fyˆ su ocenjene vrednosti zarada muškaraca i žena, M kx i F kx su srednje vrednosti objašnjavajućih promenljivih u jednačinama zarada muškaraca i žena sa pripadajućim ocenama nepoznatih parametara Mkˆ i F kˆ , dok su M 0ˆ i F 0ˆ ocene Analiza razlika u zaradama i višestrukog izbora zaposlenja 113 slobodnog člana u dvema jednačinama zarada, respektivno, a K je broj objašnjavajućih promenljivih. Blinder (1973) i Oaxaca (1973) su ukupnu razliku u zaradama raščlanili na dva dela. Prvi član s desne strane jednačine (5.4) meri deo ukupne razlike koja se javlja usled različitih prosečnih karakteristika dveju demografskih grupa i naziva se objašnjenim delom razlike ili delom razlike koja postoji zbog unapred datih karakteristika (en. endowments effect). Drugi član na desnoj strani jednačine (5.4) koji se naziva rezidualom i obuhvata deo ukupne razlike koja se pripisuje diskriminaciji protiv jedne demografske grupe, Blinder (1973) je dalje raščlanio na dva dela. Prvi deo ovog člana meri razlike u efektima objašnjavajućih promenljivih, tj. u ocenjenim parametrima za muškarce i žene (en. coefficients effect), dok drugi deo ovog člana meri razlike u ocenama slobodnih članova iz dveju jednačina i rezultat je pripadnosti određenoj demografskoj grupi (en. group membership).64 U alternativnim obrascima dekompozicije, deo ukupne razlike koja se pripisuje rezidualu se naziva neobjašnjenim delom razlike. Jann (2008) sugeriše opreznost u tumačenju ovog člana, budući da njime mogu da budu obuhvaćeni i potencijalni efekti razlika u zaradama koji se pripisuju uticajima koji se ne opažaju i stoga ne mogu da se izmere, kao što su lične karakteristike, u koje se ubrajaju motivacija, zalaganje i spremnost da se preuzme rizik, sklonost konkurenciji i sl., ili zauzimanje diskriminatornog stava prema određenoj grupi na tržištu rada. Međutim, na probleme interpretacije neobjašnjenog dela razlike ili efekta diskriminacije, u Blinder-ovom tipu dekompozicije, prvi je ukazao Jones (1983) demonstrirajući kako izbor skale merenja kod kontinuelnih promenljivih ili izbor referentne kategorije kod kategoričkih promenljivih utiču na rezidual ili deo ukupne razlike koji je nastao zbog diskriminacije. Ove promene se odražavaju na vrednost slobodnog člana u ocenjenim jednačinama zarada. Slobodnim članom su dakle obuhvaćeni i uticaji mogućeg prisustva neopaženih karakteristika, tako da se interpretacija rezidualnog dela ukupne razlike u zaradama suštinski svodi na mešovite 64 Juhn et. al (1993) su modifikovali standardni metod razlaganja razlika u srednjim vrednostima zarada Blinder-a i Oaxaca-e i predložili metod dekompozicije koji se sastoji od tri komponente, gde prva meri promene u raspodeli individualnih karakteristika (obrazovanje, iskustvo i zanimanje), druga promene u cenama posmatranih karakteristika (prinosi na obrazovanje, iskustvo i zanimanje), dok treća meri promene u raspodeli reziduala ocenjene jednačine zarada (neopaženih karakteristika), i to kroz standardnu devijaciju i rang u raspodeli zarada po percentilima. Međutim, Suen (1997) je pokazao da ovaj metod dekompozicije može dovesti do pogrešne interpretacije reziduala ocenjene jednačine zarada, budući da raspodele sa većom disperzijom imaju tanje krajeve, tako da se razlika u ocenjenim zaradama povećava sa porastom nejednakosti zarada. Ovo je naročito bitno ako se, na primer, posmatra razlika između desetog i devedesetog percentila raspodele zarada, tj. najnižih i najviših zarada. Analiza razlika u zaradama i višestrukog izbora zaposlenja 114 efekte diskriminacije i ovih neopaženih (ili izostavljenih) karakteristika (Cotton 1988). Doprinoseći diskusiji o interpretaciji rezidualnog dela Blinder-ove dekompozicije ili diskriminacije, Jones i Kelley (1984) su dali tipologiju četiri alternativna načina dekompozicije ukupne razlike u zaradama i naglasili da je veličina (ali ne i struktura) reziduala suštinski određena specifikacijom modela zarada i greškom merenja.65 Do sada nisu predložena rešenja koja bi interpretaciju rezultata dekompozicije, u delu koji se tiče efekata diskriminacije, učinila manje osetljivom na spoznaju o prisustvu neopaženih karakteristika koje nisu uključene u model. Dakle, dvočlana dekompozicija razlika u zaradama data izrazom (5.4) podrazumeva da se jedna demografska grupa, za koju se hipotetički pretpostavlja da je u neravnopravnom položaju, posmatra kroz prizmu karakteristika druge “superiorne” demografske grupe (en. counterfactual manner). Pri tome, prvi član se interpretira kao razlika u prosečnim karakteristikama dveju demografskih grupa (muškaraca i žena), ponderisana parametrima iz ocenjene jednačine zarada muškaraca, dok se drugi član interpretira kao razlika nastala usled toga kako bi se na osnovu jednačine zarada muškaraca vrednovale prosečne karakteristike žena i kako se one vrednuju na osnovu ocenjene jednačine zarada žena, uključujući i razliku u ocenama slobodnih članova. Izbor grupe za poređenje za koju se pretpostavlja da najverovatnije nije diskriminisana na tržištu rada, a u izrazu (5.4) to su muškarci, indukuje problem indeksnih brojeva (en. index number problem). Ovaj problem uzrokuje da komponente razlaganja razlika u zaradama, koje su dobijene primenom metoda Blinder-Oaxaca-e, nisu invarijantne na izbor referentne grupe, tj. da se sa promenom referentne (bazne) grupe menjaju i vrednosti komponenti dekompozicije, jer se uvek posmatraju u odnosu na referentnu grupu. Polazeći od pretpostavke da struktura zarada iz ocenjene jednačine zarada muškaraca odgovara situaciji odsustva diskriminacije i njenom zamenom sa strukturom zarada iz ocenjene jednačine zarada žena, Oaxaca (1973) je pokazao da se značajno menjaju proporcije objašnjenog i neobjašnjenog dela ukupne razlike u zaradama, čime se menja i interpretacija rezultata ocenjivanja. Problem indeksnih brojeva je indukovao 65 Levi (1973) je pokazao da je primena metoda OLS osetljiva na uključivanje objašnjavajućih promenljivih u modele koje sadrže greške merenja. Prisustvo ovih promenljivih u jednačinama zarada može da zamagli neobjašnjeni deo razlike u zaradama, nerealno ga povećavajući ili smanjujući, usled pristrasnosti ocena parametara i slobodnog člana. Analiza razlika u zaradama i višestrukog izbora zaposlenja 115 pojavu alternativnih načina razlaganja ukupnog jaza u zaradama, kao i primenu različitih ponderacionih šema što će u nastavku biti i obrazloženo. Ukoliko bismo u jednačinu (5.3a) dodali dva preuređena člana, prvi koji se odnosi na strukturu zarada muškaraca )ˆˆ(ˆˆ Fk M k F k M k   i drugi koji se tiče prosečnih karakteristika ove demografske grupe )( Fk M k F k M k xxxx  , a zatim od nje oduzeli jednačinu (5.3b), dobili bismo alterantivnu reprezentaciju dekompozicije. Sada se ova alternativna tročlana dekompozicija razlika u zaradama muškaraca i žena može izraziti na sledeći način (Blinder 1973; Jones i Kelley 1984):    K k F k M k F k FM K k F k M k F k FM xxxyy 1 00 1 )ˆˆ()ˆˆ()(ˆ)ˆln()ˆln(  (5.5)66 ),ˆˆ()( 1 F k M k K k F k M k xx    k=1,..,K. Gornji izraz je nastao na osnovu kombinovanja dveju pretpostavki Oaxaca-e (1973) koje glase: (i) da se u modelima merenja jaza u zaradama, u odsustvu diskriminacije, struktura zarada žena može jedinstveno primeniti i na muškarce, (ii) ali da važi i obrnuto, tj. da se struktura zarada muškaraca, pod istim uslovima, može jedinstveno primeniti i na žene. Dakle, prvi član u izrazu (5.5) meri deo ukupne razlike u prosečnim karakteristikama muškaraca i žena vrednovane na osnovu ocenjenih parametara iz jednačine koja determiniše strukturu zarada žena, kao i deo razlike u ocenama slobodnih članova, dok drugi član prikazuje deo ukupne razlike koja je rezultat različitog vrednovanja prosečnih karakteristika žena, tj. deo jaza koji je nastao usled toga kako se prosečne karakteristike žena stvarno vrednuju na osnovu ocenjene jednačine zarada žena i kako bi se one vrednovale na osnovu ocenjenih parametara iz jednačine zarada muškaraca. Prvi i drugi član čine deo razlike u zaradama koji se posmatra kroz prizmu postojanja diskriminacije, slično kao i u obrascu dekompozicije (5.4). Treći član se 66 Na istovetan način se mogu obrazovati članovi koji prikazuju strukturu zarada žena )]ˆˆ(ˆˆ[ Mk F k M k F k   i prosečne karakteristike žena )]([ M k F k M k F k xxxx  , čijim se dodavanjem u ocenjenu jednačinu zarada žena (5.3b), dobija obrazac dekompozicije suprotan izrazu (5.5). Analiza razlika u zaradama i višestrukog izbora zaposlenja 116 javlja usled istovremenog postojanja razlika u prosečnim karakteristikama i u ocenjenim parametrima i naziva se članom interakcije (Jones i Kelley 1984; Cotton 1988). Ovaj deo razlike se javlja zbog načina na koji se u standardnim obrascima dekompozicije formiraju članovi koji mere ili razlike u prosečnim karakteristikama ili razlike u stopama prinosa na te karakteristike i nestao bi ukoliko ne bilo razlika u vrednovanju prosečnih karakteristika žena i muškaraca. Objašnjavajući značaj interpretacije ovog člana, Cotton (1988) se poziva na empirijsko istraživanje u kojem se član interakcije interpretira kao proporcija diskriminacije protiv članova demografske grupe koja se nalazi u “inferiornom” položaju na tržištu rada, a čije karakteristike su iznad proseka. Ako se vratimo na obrazac dekompozicije (5.4) i pretpostavimo da je proširen dodavanjem novog vektora parametra  kˆ , koji ilustruje strukturu zarada u odsustvu diskriminacije, dobijamo sledeći izraz:        K k K k F kk F kk M k M k F k M kk FM xxxxyy 1 1 )ˆˆ()ˆˆ()(ˆ)ˆln()ˆln(  , k=1,..,K. (5.6) Kao i u ranijem prikazivanju razlaganja razlika u zaradama, prvi član na desnoj strani predstavlja objašnjeni, a drugi neobjašnjeni deo ukupne razlike, ili deo razlike koja se javlja zbog diskriminacije. Ocena slobodnog člana 0ˆ je zbog pojednostavljenja izraza (5.6) uključena u vektor ocena parametara kˆ . Interpretacija rezultata dekompozicije predstavljena izrazom (5.6) počiva na polaznoj pretpostavci da u ocenjivanim modelima zarada nisu izostavljeni relevantni regresori. Polazeći od teorije diskriminacije koja sugeriše da se diskriminacija javlja u formi pozitivne (grupa je favorizovana na tržištu) ili negativne (grupa trpi posledice) diskriminacije, neobjašnjeni deo jaza u zaradama se može dalje raščlaniti na dve komponente (Oaxaca i Ransom 1994). Ukoliko su dobijeni vektori ocenjenih parametara koji ilustruju nivo diskriminacije specifični za određenu demografsku grupu, označimo ih sa M kˆ i F kˆ , tada se vektori ocenjenih parametara strukture zarada muškaraca i žena mogu predstaviti redom: Mkk M k  ˆ ˆˆ   i F kk F k  ˆ ˆˆ   . Nakon toga, neobjašnjeni deo razlike u zaradama se može raščlaniti na Analiza razlika u zaradama i višestrukog izbora zaposlenja 117 dva dela: (i) na deo koji meri pozitivnu diskriminaciju muškaraca (  K k M k M kx 1 ˆ ), (ii) kao i na deo koji predstavlja negativnu diskriminaciju žena (  K k F k F kx 1 ˆ ). Kao što vidimo iz izraza (5.6), da bismo identifikovali ocenjene parametre, problem izbora strukture zarada referentne grupe ostaje i dalje aktuelan. U ekonomskoj literaturi je dato nekoliko sugestija o dekompoziciji razlika u zaradama i o načinu izbora referentne grupe čija struktura zarada nije određena pod uticajem diskriminacije. Jann (2008) polazi od Reimers-ove ponderacione formule prema kojoj se vektor ocenjenih parametara, koji determiniše strukturu zarada u odsustvu diskriminacije, određuje kao zbir ocenjenih parametara iz jednačine zarada muškaraca i žena, pri čemu se svaki vektor ocenjenih parametara ponderiše jednom polovinom: Fk M kk  ˆ2/1ˆ2/1ˆ  . Cotton (1988) je predložio određivanje strukture zarada koje nisu opterećene diskriminacijom na tržištu na način da se vektori ocenjenih parametara iz dveju jednačina zarada ponderišu učešćem svake demografske grupe u ukupnom uzorku, tj. F k FM k M k ww  ˆˆˆ  , gde su Mw i Fw proporcije muškaraca i žena u posmatranom uzorku, respektivno. Navedene procedure podrazumevaju da se zarade muškaraca i žena ocenjuju posebno za svaki poduzorak. Takođe, Oaxaca i Ransom (1994) su predložili metod dekompozicije u kojem parametri jednačine zarada, ocenjeni na ukupnom uzorku muškaraca i žena, ilustruju strukturu zarada u odsustvu diskriminacije koja dozvoljava da se obe demografske grupe istovremeno posmatraju i kao referentne grupe. Međutim, Jann (2008) je pokazao da primena ovog metoda omogućava da se deo neobjašnjene razlike “prelije” u objašnjeni deo jaza u zaradama, te je predložio da se u slučaju ocenjivanja strukture zarada na ukupnom uzorku, u skup objašnjavajućih promenljivih doda veštačka promenljiva koja je indikator pripadnosti određenoj demografskoj grupi. Polazeći od pretpostavke da se zarade žena formiraju pod uticajem diskriminacije i da nema pozitivne diskriminacije u određivanju zarada muškaraca, ocenu parametara iz jednačine (5.3a), tj. ocenjenu strukturu zarada muškaraca, možemo koristiti kao ekvivalent ocenjenom vektoru parametara za slučaj da ne postoji diskriminacija, tj. Analiza razlika u zaradama i višestrukog izbora zaposlenja 118  k M k  ˆˆ . Time se izraz (5.6) jednostavnom transformacijom članova može svesti na standardni obrazac dekompozicije Blinder-Oaxaca-e (5.4). Da bi se omogućilo statističko zaključivanje na osnovu ocenjenih članova dekompozicije razlika u prosečnim zaradama, Oaxaca i Ransom (1998) i Jann (2008) su predložili odgovarajuće aproksimacije za ocene varijansi. 67 Poći ćemo od izraza za ocenu varijansi objašnjenog i neobjašnjenog dela jaza koji su prikazali Oaxaca i Ransom (1998): ))(ˆ(ˆ)(]1ˆ)[(]ˆ)[(ˆ ' 2 1 F k M k M k F k M k K k M k F k M k M k F k M k xxarVxxxxxxarV     , (5.7a) M k F k M k M k K k F k M k F k F k M k F k xarVarVxxxarV )] ˆ(ˆ)ˆ(ˆ[]1)ˆˆ([)]ˆˆ([ˆ ' 2 1     . (5.7b) U izrazima (5.7a) i (5.7b) (.)ˆarV je ocenjena matrica varijansi i kovarijansi iz jednačina zarada (5.3a) i (5.3b). Ukoliko je struktura reziduala u ocenjenim jednačinama zarada homoskedastična, ocenjena matrica varijansi i kovarijansi je 1'2 )(ˆˆ  xxarV  , gde je 2ˆ ocenjena varijansa reziduala, a u slučaju heteroskedastičnosti reziduala konzistentna ocena matrice varijansi i kovarijansi se dobija primenom standardne White-ove procedure 1''1'2 ))(()(ˆˆ   xxxxxxarV  (White 1980). Jann (2008) je predložio aproksimaciju ocenjene varijanse objašnjenog i neobjašnjenog dela jaza koja se zasniva na pretpostavci da je varijansa sume dve slučajne promenljive koje nisu međusobno korelisane jednaka sumi njihovih pojedinačnih varijansi:    ))(ˆ(ˆ)(]ˆ)[(ˆ 1 ' F k M k M k K k F k M k M k F k M k xxarVxxxxarV  (5.8a)    K k M k F k M k M k xVarxarV 1 ' ˆ)]()(ˆ[ˆ  ,    K k F k F k M k F k F k M k F k xarVarVxxarV 1 ' )]ˆ(ˆ)ˆ(ˆ[)]ˆˆ([ˆ  (5.8b) 67 Greene (2012: str. 79-80) je dao alternativan način izračunavanja intervala poverenja da bi se omogućilo zaključivanje o statističkoj značajnosti objašnjenog i neobjašnjenog dela u standardnoj Blinder-Oaxaca dekompoziciji. Analiza razlika u zaradama i višestrukog izbora zaposlenja 119 )ˆˆ()(ˆ)ˆˆ( 1 ' F k M k K k F k F k M k xarV    , pri čemu su )ˆ(ˆ MkarV  i ) ˆ(ˆ FkarV  ocene varijansi i kovarijansi u jednačinama zarada, dok su ocene varijansi objašnjavajućih promenljivih, centriranih oko sopstvenih srednjih vrednosti, u jednačinama zarada muškaraca (5.3a) i žena (5.3b), )1(/)()(ˆ '  nnxxxarV Mk M k M k i )1(/)()( ˆ '  nnxxxarV Fk F k F k , respektivno. Polazeći od pretpostavke da struktura zarada žena odgovara situaciji odsustva diskriminacije u određivanju nivoa zarada, tj. )ˆˆ(  k F k  , te zatim transformacijom članova na desnoj strani izraza (5.4), analogno mogu da se izvedu formule, slične gore prikazanim (5.8a) i (5.8b), za ocenu varijansi objašnjenog i neobjašnjenog dela ukupnog jaza u zaradama radi testiranja njihove statističke značajnosti. 5.1.2 Metodi detaljne dekompozicije razlika u zaradama Kao što je već istaknuto u prethodnoj tački, rezultati detaljne dekompozicije razlika u zaradama, kojom se meri deo neobjašnjenog jaza, nastalog kao rezultat doprinosa pojedinačne objašnjavajuće promenljive, nisu invarijantni na izbor referentne kategorije, ako skup objašnjavajućih promenljivih sadrži jednu ili više kategoričkih promenljivih (Jones 1983; Jones i Kelley 1984). Ukoliko se kategoričke promenljive, koje se sastoje od skupa veštačkih (binarnih) promenljivih sa vrednostima 1 i 0, uključuju u jednačine zarada (kao što su npr. pol, bračni status, nivo obrazovanja, zanimanje, ekonomski sektor i sl.), problem identifikacije ocenjenih parametara proizlazi iz činjenice da je slobodnim članom obuhvaćen uticaj isključenih kategorija za svaku od pojedinačnih kategoričkih promenljivih. Promena referentne (tj. bazne ili isključene) kategorije neminovno se odražava i na ocenu slobodnog člana.68 Oaxaca i Ransom (1999) su pokazali da su ukupni efekti razlika u zaradama, kao i objašnjeni deo razlike invarijantni na izbor referentne kategorije u skupu veštačkih promenljivih bilo da je u modele zarada 68 Standardna primena metoda OLS u ocenjivanju modela koji sadrže konstantu i jednu ili više kategoričkih promenljivih podrazumeva da se iz skupa veštačkih, za svaku od kategoričkih promenljivih u modelu, izostavi jedna veštačka promenljiva da bi se izbegla perfektna multikolinearnost. Analiza razlika u zaradama i višestrukog izbora zaposlenja 120 uključena jedna ili više kategoričkih promenljivih. Međutim, uticaji pojedinačnih veštačkih promenljivih na neobjašnjeni deo razlike u zaradama se menjaju u zavisnosti od izbora referentne kategorije. Razlog tome je što ocenjeni parametri uz veštačke promenljive mere doprinos toj razlici u odnosu na isključenu veštačku promenljivu, tako da se sa promenom referentne kategorije, menjaju i rezultati dekompozicije. Izbor referentne kategorije, dakle, utiče na doprinos neobjašnjenom delu razlike, ne samo kroz promenu uticaja pojedinačne veštačke promenljive, već i kroz promenu celokupnog uticaja kategoričke promenljive (Oaxaca i Ransom 1999; Jann 2008). Otuda proizlazi da u detaljnoj dekompoziciji razlika u zaradama, neobjašnjeni deo razlike ima smislenu interpretaciju samo za one slučajne promenljive koje sadrže prirodnu tačku nula. Kod kategoričkih promenljivih isključenjem referentne kategorije “veštački” određujemo tačku nula (Jones i Kelley 1984). Polazeći od predloga za rešenje problema identifikacije, uzrokovanog izborom referentne kategorije kod skupa veštačkih promenljivih u modelima detaljnog razlaganja razlika u zaradama, koji su dali Fields i Wolff (1995), Horrace i Oaxaca (2001) su predložili alternativan način merenja jaza u zaradama koji je rezultat razlika u ocenjenim parametrima (tj. u strukturi zarada). Njihov pristup, problemu identifikacije ocenjenih parametara, nudi rešenje kroz uprosečavanje karakteristika obe ili jedne demografske grupe za sve veštačke promenljive.69 Međutim, predlog da se zajedničke karakteristike celog uzorka analiziraju samo kroz prosečne karakteristike žena u uzorku, tj.    FN i F i F xx 1 , čime neobjašnjeni deo jaza postaje )]ˆˆ([ FMFx   , dok se uticaj slobodnog člana posmatra izolovano, istovremeno omogućava da se otkrije kako bi žene bile plaćene kada bi imale iste karakteristike kao i muškarci. Takođe, predložena je i procedura za izračunavanje varijansi ocena, što omogućava izvođenje zaključaka o statističkoj pouzdanosti i vrednosti ocenjenih komponenti razlika u zaradama muškaraca i žena. 69 Ovo rešenje je nastalo zbog toga što deo ocenjenog jaza, koji je rezultat razlika u ocenama parametara za jednu veštačku promenljivu, varira sa prosečnim karakteristikama žena za preostale iz skupa veštačkih promenljivih koje formiraju datu kategoričku promenljivu, tj. F dz , d=1,…, D-1. Dakle, ako se posmatra jaz u zaradama, na primer, na nivou zanimanja ili ekonomskih sektora, razlika u ocenama parametara, bez slobodnog člana, zavisi od prosečnih karakteristika lica sa datim zanimanjem ili zaposlenih u datom ekonomskom sektoru, te stoga varira sa d, tj. )ˆˆ( FMFdz   (Horrace i Oaxaca 2001). Analiza razlika u zaradama i višestrukog izbora zaposlenja 121 Ukoliko se sada vratimo na model (5.4), detaljna dekompozicija objašnjenog i neobjašnjenog dela ukupnog jaza može da se izrazi sledećim skupom jednačina: )(ˆ...)(ˆ)(ˆ 111 1 F K M K M K FMM K k F k M k M k xxxxxx    , (5.9a) )ˆˆ(...)ˆˆ()ˆˆ()ˆˆ( 111 1 00 F K M K F K FMF K k FMF k M k F k xxx    , (5.9b) gde izraz (5.9a) reprezentuje detaljnu dekompoziciju objašnjenog dela jaza ili dela jaza koji je rezultat razlika u prosečnim karakteristikama muškaraca i žena, dok izraz (5.9b) prikazuje neobjašnjeni deo jaza, tj. deo jaza koji je rezultat samo pripadnosti datoj demografskoj grupi (odnosno razlika u ocenama slobodnih članova), kao i različitog vrednovanja istih karakteristika koje poseduju pripadnici ove dve demografske grupe. Ukoliko zatim pretpostavimo da skup objašnjavajućih promenljivih sadrži barem jednu kategoričku promenljivu z koja se sastoji od D kategorija, d=1,...,D, u opštem slučaju, jednačina zarada može da se izrazi sledećom formulom: i D d idd K k ikki zxy      1 11 0)ln( , i=1,2,..,N, k=1,...,K, d=1,...,D-1. (5.10) U gornjem izrazu 0 je slobodni član, k je skup nepoznatih parametara uz objašnjavajuće promenljive ikx , k=1,...,K, dok je d skup nepoznatih parametara uz veštačke promenljive idz , d=1,...,D-1, gde je iDz D-ta referentna (isključena) veštačka promenljiva, a i je slučajna greška. Predloženo je nekoliko rešenja za identifikaciju ocenjenih parametara uz veštačke promenljive u detaljnoj dekompoziciji razlika u zaradama muškaraca i žena. Uslov koji treba da bude ispunjen da bi identifikacija ocenjenih parametara bila moguća jeste da je suma parametara uz veštačke promenljive normalizovana u nuli, tj.    D d d 1 0 . Da bi ovaj uslov bio ispunjen, Gardeazabal i Ugidos (2004) su predložili transformaciju veštačkih promenljivih pre ocenjivanja, tako što se u Analiza razlika u zaradama i višestrukog izbora zaposlenja 122 model uključuje D-1 veštačkih promenljivih koje su izražene u formi odstupanja od izostavljene veštačke promenljive koja reprezentuje referentnu kategoriju. Ova procedura se ponavlja za svaku kategoričku promenljivu u modelu. Nakon primene metoda OLS, ocenjeni parametri uz transformisane veštačke promenljive mere direktne efekte uključenih veštačkih promenljivih, dok se ocena uz izostavljenu veštačku promenljivu dobija kao zbir ovih ocena, tj.     1 1 ˆˆ D d dd  , d=1,...,D-1. Drugo rešenje, koje rezultate detaljne dekompozicije dobijene standardnim metodom Blinder-Oaxaca-e čini invarijatnim na izbor referentne kategorije, sastoji se u iterativnom ocenjivanju modela u kojima se naizmenično isključuje po jedna iz skupa veštačkih promenljivih koje reprezentuju uticaj kategoričke promenljive na rezultate ocenjivanja (Jann 2008). Nakon toga transformiše se vektor ocenjenih parametara i dodaje parametar uz izostavljenu veštačku promenljivu. To znači da je u modelu (5.10) ocenjeni parametar uz D-tu izostavljenu veštačku promenljivu jednak nula, tj. 0D , dok je prosečna vrednost svih parametara određena izrazom: DD /)...( 1   . Ukoliko se sada vratimo na model (5.10) i prikažemo ga u formi transformisanog modela dobijamo: iiDDi K k ikki zzxy     ~...~ ~ )ln( 11 1 0 , i=1,2,..,N, k=1,...,K, d=1,...,D, (5.11) gde su transformisani parametri   00 ~ i   dd ~ , dok su k i ikx prethodno determinisani, a i je slučajna greška. Dakle, izrazi (5.10) i (5.11) su matematički ekvivalentni pod uslovom da je suma transformisanih parametara uz veštačke promenljive, koji su preuređeni na način da predstavljaju odstupanje od zajedničke sredine, jednaka nula. Jednostavnosti radi, primenom metoda Blinder-Oaxaca-e detaljnu dekompoziciju razlika u zaradama muškaraca i žena, koja se meri samo kroz doprinos kategoričkih promenljivih, možemo izraziti na sledeći način:      D d D d F d M d M d F d M d F d FMFM zzzyy 1 1 00 )( ~)~~() ~~ ()ˆln()ˆln(  . (5.12) Analiza razlika u zaradama i višestrukog izbora zaposlenja 123 Prvi član, zajedno sa razlikom u transformisanim ocenama slobodnih članova, predstavlja neobjašnjeni deo razlike, dok drugi član predstavlja deo razlike koji je objašnjen uticajem date kategoričke promenljive. Izrazi pod sumom mogu da se razviju tako da mere pojedinačne uticaje svake od promenljivih iz skupa veštačkih promenljivih, d=1,...,D. Interpretacija članova dekompozicije u slučaju prisustva kategoričkih promenljivih je istovetna klasičnoj interpretaciji rezultata dekompozicije. Konzistentne ocene varijansi i kovarijansi za transformisane ocene parametara, tj. )~(ˆ darV  , moguće je dobiti primenom standardnih formula za izračunavanje matrice varijansi i kovarijansi ponderisanih suma slučajnih promenljivih, koje se zasnivaju na zakonitosti da je varijansa razlike (zbira) dve slučajne promenljive jednaka razlici (zbiru) varijansi dve slučajne promenljive, tj. )()()( 2121 iiii xVarxVarxxVar  (Jann 2008). 5.2 Proširenje standardnog obrasca dekompozicije razlika u zaradama nakon izbora metoda ocenjivanja 5.2.1 Metod dekompozicije u modelima sa korekcijom za neslučajan izbor podataka Primena metoda dekompozicije Blinder-Oaxaca-e u modelima sa korekcijom za neslučajan izbor podataka bazira se na Heckman-ovom (1976, 1979) pristupu i modelu izbora podataka (2.24a)–(2.24d) (videti tačku 2.2.1). Polazi se od pretpostavke da izbor pojedinca da se uključi u tržište rada nije slučajan i da neopažene karakteristike koje određuju nečiju stvarnu zaradu nisu nezavisne od odluke pojedinca da li će da radi ili ne. Drugim rečima, ponuđena zarada (en. offered wage) takođe može da utiče na odluku pojedinca o tome da li će da radi ili ne. Dakle, ako su neopažene karakteristike, koje utiču na odluke pojedinaca da se priključe radnoj snazi, korelisane sa posmatranim karakteristikama u jednačini zarada, tada će njihovo zanemarivanje dovesti do pristrasnih ocena dobijenih metodom OLS u jednačini zarada. Poznato je da mehanizam izbora podataka sugeriše da se stvarna zarada iy posmatra samo za i-tog pojedinca, u uzorku veličine N, koji je doneo pozitivnu odluku da radi, tj. Analiza razlika u zaradama i višestrukog izbora zaposlenja 124 * ii yy  kada je 1id . Dakle, očekivana vrednost od iy , odnosno očekivana zarada za pojedinca koji radi, može da se prikaže na sledeći način: iiiiiiii xzExdzyE   '' i ' ]|[]1,|[ , (5.13) gde je  koeficijent korelacije između i i i ,  je koren iz rezidualne varijanse u jednačini zarada, )(/)( ''  iii zz  je inverzni Mills-ov količnik, a (.) i  (.) su funkcija gustine i funkcija raspodele standardizovane normalne slučajne promenljive, respektivno. Jednačina zarada samo za one koji rade, tj. na cenzurisanom uzorku opservacija, i=1,...,N1