5.1. Sentrale omgrep og statistiske teknikkar i analysar av homogami- og mobilitetstabellar.


5.1. Sentrale omgrep og statistiske teknikkar i analysar av homogami- og mobilitetstabellar.

Ein mobilitets- eller ”turnover”-tabell (ein tabell der rekke- og kolonne-variabelen er identisk koda) rommar opplysningar om eit individ sine eigenskapar på to ulike tidspunkt. I intergenerasjonelle analysar vil dette td. vere fars eller mors utdanning og respondenten si eiga utdanning, medan det i intragenerasjonelle analysar td. vil vere ei gruppe respondentar sine yrker på tidspunkt 1 og på tidspunkt 2. For å trekkje slutningar om mønstra i slike tabellar er det vanleg å skilje mellom fleire ulike typar mobilitet. Omfanget av total mobilitet (oppgjeve i prosent) fortel kor mange som har skifta posisjon frå ein generasjon til den neste, eller frå tidspunkt 1 til tidspunkt 2. Utflytprosenten viser oss kvar dei som skifter posisjon har vandra, medan innflytprosenten fortel oss kvar ifrå ein gjeven kategori har rekruttert ”sine” respondentar. Oftast vil tabellen sine marginalfordelingar vere ulike, td. fordi utdanningsnivået har auka eller fordi avindustrialisering gjer at yrkesstrukturen endrar seg frå ein generasjon til den neste. Desse endringane vil ”tvinge” ein del av respondentane over i andre posisjonar enn foreldra, og denne forma for mobilitet vert gjerne omtalt som strukturell mobilitet. I analysane søkjer ein derfor å skilje mellom strukturell og relativ mobilitet. Den relative mobiliteten er dei endringane frå ein generasjon til den neste som ikkje kan tilskrivast strukturell mobiliteten, og karakteren til desse endringane er det ein ofte prøver å avklare gjennom analysen[35].

Ei vanleg oppfatning er at dei loglineære analyseteknikkane er dei som best er i stand til å skilje mellom strukturell og relativ mobilitet. Frå slutten av 1970-talet og framover har loglineær modellering, ein analyseteknikk utvikla av amerikanaren Leo A. Goodman, derfor vore den klart dominerande i kvantitativt fundert sosiologisk forsking omkring homogami og mobilitet. I motsetnad til lineære eller logistiske regresjonsmodellar, har desse i avgrensa grad vorte tekne i bruk innan norsk samfunnsvitskap[36]. Vi skal derfor kort gå gjennom grunnlogikken i teknikken, men utan å gå i inn på dei tekniske detaljane[37].

Ein loglineær modell er ein lineær modell for logaritmane av frekvensane i ein enkel eller multippel tabell. Modellen tek form av ein hypotese om korleis samanhengen mellom variablane i tabellen artar seg, og spesifiserer ein forventa frekvens for kvar tabellcelle som så vert samanlikna med den observerte frekvensen for den same cella. Målet for analysen er å finne den modellen som best er i stand til å skildre strukturen i tabellen. I vanleg hypoteseprøving gjeld det å finne statistisk signifikante resultat (td. i form av p-verdiar på.05-nivå). For ein loglineær modell er det derimot om å gjere å finne ein modell som ikkje er statistisk signifikant[38]; modellen skal helst aksepterast. Dersom fleire modellar innfrir dette kravet, har enkle modellar (modellar som legg få føresetnader eller restriksjonar på tabellen) forrang framfor dei meir komplekse, så sant ikkje forbetringa frå ein modell til den neste er statistisk signifikant. Er dei like med omsyn til kompleksitet, vel ein den modellen som gjev den høgaste absolutte negative verdien for BIC (Bayesian Information Criterion).

I valet av modell og i tolkinga av resultata den gjev, tek ein utgangspunkt i forholdet mellom verdiane på L2 (ofte kalla ”goodness-of-fit”, eit statistisk mål på kor godt den spesifiserte modellen høver for tabellen[39]), talet på fridomsgrader (DF), p-verdiane, ulikskapsindeksen (Diss. index) og dei ulike parameterestimata for tabellcellene. Noko forenkla skal avstanden mellom verdien på ”goodness-of-fit” og talet på fridomsgrader helst vere liten. Dersom ulikskapsindeksen i tillegg får låge verdiar, tyder det at berre eit fåtal av respondentane må ”bytte” tabellposisjon for at vi skal få ein perfekt tilpassa modell[40]. Ettersom låge cellefrekvensar, tomme tabellceller og strukturelle nullar skapar vanskar, kan ein i praksis sjeldan analysere samanhengar mellom meir enn 5 variablar ved hjelp av loglineære analyseteknikkar (Lebart & al.1998). Ofte vil også mykje av kompleksiteten i materialet gå tapt, då talet på variabelkategoriar i praksis må haldast så lågt som mogleg, ofte så lågt som 2 eller 3 kategoriar for kvar variabel.

Så sant ikkje datamengda er sterkt skeivfordelt, er dette eit noko mindre problem i analysar av samanhengar mellom to variablar, td. mobilitets-, homogami- og andre typar ”turnover”-tabellar. Derimot vil det at frekvensane i diagonalcellene ofte er mykje høgare enn i dei andre cellene i tabellen (avdi stabilitet eller immobilitet er eit langt meir framtredande element enn endring eller mobilitet), kunne skape vanskar. Dette gjeld også i våre data. Medan vi kunne ynskt ein noko jamnare distribusjon i tabell 2.1, gjeld vanskane i høve til diagonalcellene både tabell 2.1 og 2.2. Ein mykje brukt framgangsmåte er derfor å spesifisere ein modell som gjev ei perfekt tilpassing for diagonalcellene, medan ein set fram hypotesar om korleis tabellsamanhengen rundt diagonalen artar seg. Slike modellar vert også kalla ”kvasi”-modellar, og vil bli nytta i analysane som følgjer.


[35]Sjå Luijkx 1994 og Goldthorpe 2000 for ei kortfatta innføring i desse omgrepa. Sjå Merllié 1994 for ei historisk oversikt over ulike tradisjonar i mobilitetsforskinga. []

36To viktige unntak er Rogoff Ramsøy (1977, analysar i appendiks) og Ringdal 1990. []

37For ei innføring i loglineære modellar for mobilitetstabellar, sjå Hagenaars 1990, Hout 1983, Luijkx (ibid) og Bijleveld, van der Kamp & Mooijaart 1998. []

38Som dette tilseier, vil ein i analysar av svært store utval derfor kunne få vanskar med i det heile å få akseptert ein loglineær modell. Sjå elles Upton 1991 for ei god og lettfatta innføring i eksplorerande bruk av loglineære modellar. []

39I analysar av store utval, vil verdien på "goodness-of-fit" og kjikvadratet ofte bli relativt like. []

40Ein verdi for ulikskapsindeksen på.02, tyder at 2% av respondentane må bytte posisjon for at den gjevne modellen skal gje ei perfekt skildring av tabellstrukturen. Vi skal komme attende til tolkinga av parameterestimata nedanfor.


Publisert 25. nov. 2010 13:52