Hvem emigrerer fra Norge?

(1)

Hvem emigrerer fra Norge?

En empirisk analyse

Kristian Vigsø

Masteroppgave

Masteroppgaven er levert for å fullføre graden Master i samfunnsøkonomi

Universitetet i Bergen, Institutt for økonomi [Juni 2021]

(2)

Forord

Denne oppgaven markerer slutten på fem fine år ved Institutt for økonomi ved UiB. Jeg vil rette en stor takk til min veileder Espen Bratberg for tips til oppgave, tilrettelegging av data og gode tilbakemeldinger underveis i skriveprosessen. Videre vil jeg takke alle mine medstudenter for en flott og minnerik studietid.

(3)

Sammendrag

Norge har vært karakterisert ved en sammenpresset lønnsfordeling som impliserer at avkastningen av utdanning og annen kompetanse er relativt lav i Norge. Det betyr at det i hovedsak er individer med høyt kompetansenivå som vil tjene på å emigrere fra Norge. Med utgangspunkt i norske registerdata fra perioden 1993-2003 undersøker denne oppgaven hva som kjennetegner norske emigranter når det gjelder utdanning og annen kompetanse.

Roy-modellen predikerer at det er avkastningen av utdanning og annen kompetanse som driver migrasjonsstrømmene over landegrensene. I et land som Norge, hvor avkastningen av kompetanse er relativt lav, vil Roy-modellen predikere at emigrasjonsstrømmen hovedsakelig er positivt selektert. Positiv seleksjon betyr at emigrantene tilhører den øvre delen av kompetansefordelingen. Oppgaven tester prediksjonene til Roy-modellen med utgangspunkt i rammeverket til Borjas et al. (2019). De har gjort et tilsvarende arbeid på danske data.

Oppgaven benytter metoder for å undersøke hvordan emigrantene er selektert på observert og uobservert kompetanse. I oppgaven blir utdanning brukt som et mål på observert kompetanse, og residualer fra lønnsligninger blir brukt som et mål på uobservert kompetanse. Inntekten til et individ avhenger av både observert og uobservert kompetanse. Hvordan emigrantene er selektert på inntekt avhenger derfor av begge kompetansetypene.

Resultatene til oppgaven viser at emigrantene har de forventede kjennetegnene. Tilbøyeligheten til å emigrere stiger med utdanningsnivået. Videre viser resultatene at emigrantene har et høyere inntektsnivå og uobservert kompetansenivå enn ikke-emigrantene. Resultatene viser derfor at emigrantene er positivt selektert på observert og uobservert kompetanse. Til den statistiske analysen har STATA/SE 16.1 blitt brukt.

(4)

Innholdsfortegnelse

1 Innledning ... 1

2 Litteraturoversikt ... 3

2.1 Immigrasjon til Norge ... 3

2.2 Emigrasjon ut av Norge og Norden ... 4

2.3 Emigrasjon andre steder i verden ... 6

2.4 Oppsummering av litteraturoversikten ... 7

3 Teoretisk rammeverk ... 9

3.1 Positiv og negativ seleksjon ... 9

3.2 Roy-modellen ... 10

4 Data og utvalgsdesign ... 16

4.1 Data ... 16

4.2 Utvalgsdesign ... 17

4.3 Deskriptiv statistikk ... 19

5 Metode ... 24

5.1 Seleksjon på observerbar kompetanse ... 24

5.2 Seleksjon på uobserverbar kompetanse ... 25

5.3 Metode for å undersøke om fordelingene er ulike ... 27

6 Resultater og diskusjon ... 29

6.1 Seleksjon på observerbar kompetanse ... 29

6.2 Analyse av stokastisk dominans prediksjonen til Roy-modellen ... 31

6.2.1 Seleksjon på uobserverbar kompetanse ... 33

6.2.2 Seleksjon på inntekt ... 39

6.3 Begrensninger i analysen ... 44

6.4 Sammenligning med Borjas et al. (2019) og andre studier ... 45

7 Oppsummering og avsluttende kommentar ... 47

Litteraturliste ... 49

Appendiks ... 52

A.1 Negativ seleksjon ... 52

A.2 Inndeling av utdanningskategorier ... 52

A.3 Metode for å undersøke om fordelingene er ulike ... 54

A.4 Kolmogorov-Smirnov-test ... 56

A.5 Lineær sannsynlighetsmodell ... 57

A.6 Kumulative fordelingsfunksjoner ... 58

A.7 Sensitivitetsanalyse for kvinner ... 61

A.8 Deskriptiv statistikk for emigranter med kjent destinasjonsområde ... 64

(5)

Tabelliste

Tabell 1: Deskriptiv statistikk for menn...20

Tabell 2: Deskriptiv statistikk for kvinner...21

Tabell 3: Oversikt over panelet for menn...23

Tabell 4: Oversikt over panelet for kvinner...23

Tabell 5: Gjennomsnittlige marginaleffekter fra logistisk regresjon...29

Tabell 6: Lønnsligninger………...….33

Tabell 7: Lønnsligninger………..….34

Tabell A.1: Nivåinndeling i NUS2000...53

Tabell A.2: Nivåinndeling av utdanning i denne oppgaven...53

Tabell A.3: Lineær sannsynlighetsmodell...57

Tabell A.4: Deskriptiv statistikk for kvinner (inntektsgrense på 150 000 (2015-NOK)) ...61

Tabell A.5: Deskriptiv statistikk for emigranter med kjent destinasjonsområde...64

(6)

Figurliste

Figur 1: Positiv seleksjon...12

Figur 2: Kumulative fordelinger av residuallønninger (standardisert inntekt)...36

Figur 3: Estimert differanse mellom kumulative fordelinger med konfidensintervall...37

Figur 4: Kumulative fordelinger av standardisert inntekt...40

Figur 5: Estimert differanse mellom kumulative fordelinger med konfidensintervall...41

Figur 6: Kumulative fordelinger av standardisert inntekt (korttids- og langtidsemigranter)...43

Figur A.1: Negativ seleksjon...52

Figur A.2: Kumulative fordelinger av residuallønninger (ikke-standardisert inntekt)...58

Figur A.3: Kumulative fordelinger av residuallønninger (ikke-standardisert inntekt)...59

Figur A.4: Kumulative fordelinger av residuallønninger (standardisert inntekt)...60

Figur A.5: Sensitivitetsanalyse for kvinner (seleksjon på inntekt)...62

Figur A.6: Sensitivitetsanalyse for kvinner (seleksjon på uobservert kompetanse)...63

(7)

1 Innledning

Den internasjonale migrasjonen har økt over tid, både i absolutte tall og som prosent av verdens befolkning. I 2019 var det estimert at verden hadde ca. 272 millioner internasjonale migranter, som er 3,5 % av verdens befolkning.¹ Til en sammenligning var det ca. 153 millioner internasjonale migranter i 1990, som var 2,9 % av verdens befolkning den gangen. Det som får størst oppmerksomhet er migrasjonen inn til vestlige rike land. Migrasjonsstrømmen inn til Europa er dominert av migranter fra Afrika og Asia. Nord-Amerika mottar særlig mange migranter fra Latin- og Sør-Amerika. Rundt 50 % av verdens internasjonale migranter i 2019 bodde i Europa og Nord-Amerika (IOM 2020).

Migrasjonen innad i Europa har også økt over tid. Utvidelsen av EU østover har medført at en rekke øst-europeere har flyttet til Vest-Europa. I 2019 bodde 3,3 % av EUs befolkning, i aldersgruppen 20-66, i et annet EU-land enn hvor deres statsborgerskap tilhører. Dette er en økning fra 2009 hvor det var 2,4 % for samme gruppe. Det er stor variasjon mellom medlemslandene. Mange østeuropeiske land har høy andel av befolkningen, i aldersgruppen 20-66, som bor utenlands i et annet EU-land, mens andelen er lav for de fleste vesteuropeiske og nordiske landene. For samme alderspopulasjon bodde 1,6 % av norske statsborgere i et europeisk EU-land i 2009, hvor andelen ble redusert til 1,4 % i 2019 (Eurostat 2020). Siden januar 1994 har nordmenn hatt like rettigheter som andre EØS-borgere til å ta arbeid, studere og bo i alle EØS-land (Regjeringen 2021).

Krig og konflikt, politiske årsaker eller et ønske om å oppnå en høyere inntekt er eksempler på motiver på hvorfor et individ velger å emigrere fra hjemlandet sitt. Det vil være mange faktorer som påvirker hvilket destinasjonsland migranter velger, men inntektsmulighetene i destinasjonslandet vil trolig være en viktig faktor for mange migranter uansett hovedmotiv.

Norge har relativt lav avkastning av kompetanse (Bratsberg et al. 2014). Det impliserer at Roy- modellen predikerer at emigrasjonsstrømmen ut av Norge hovedsakelig vil være positivt

1 Migrant er en samlebetegnelse for emigrant og immigrant. Som en migrant er man både en utvandrer (emigrant) fra landet man forlater og innvandrer (immigrant) til landet man flytter til (Tønnesen 2021). Fra kapittel 3 og ut vil jeg hovedsakelig bruke ordet emigrant. I kapittel 1 og 2 blir alle tre ordene jevnlig brukt.

(8)

selektert. Det vil si at emigrantene tilhører den øvre delen av kompetansefordelingen. På den andre siden vil immigrantene til Norge i hovedsak være negativt selektert.²

Det har nylig blitt publisert en vitenskapelig studie som analyserer emigrasjonsstrømmen ut av Danmark, hvor studien tester prediksjonene til Roy-modellen. I likhet med Norge er Danmark et land med relativt lav avkastning av kompetanse (Borjas et al. 2019). Roy-modellen predikerer derfor at danske emigranter i hovedsak vil være positivt selektert. De empiriske funnene til Borjas et al. (2019) bekrefter denne prediksjonen. Det eksisterer studier som har sett på emigrasjonsstrømmen ut av Norge (Schrøder 1996; Pedersen et al. 2003; Pedersen et al. 2008).

Kort oppsummert finner de at norske emigranter har mer utdannelse og inntekt enn ikke- emigrantene. De tester ikke prediksjonene til Roy-modellen i samme grad som Borjas et al.

(2019) gjør. Motivasjonen for denne oppgaven vil derfor være å undersøke om atferden til norske emigranter samsvarer med prediksjonene til Roy-modellen. Oppgaven vil, så langt det lar seg gjøre, replikere analysen til Borjas et al. (2019) ved å bruke norske data.

Oppgaven har følgende struktur: I kapittel 2 gjør jeg rede for relevant litteratur. I kapittel 3 presenterer jeg prediksjonene til Roy-modellen som jeg skal teste empirisk. I kapittel 4 blir data, utvalgsdesign og deskriptiv statistikk presentert. I kapittel 5 gjør jeg rede for metodene jeg benytter i oppgaven. I kapittel 6 blir resultatene formidlet og drøftet. Til slutt vil jeg oppsummere og gi en avsluttende kommentar i kapittel 7.

2 Litteraturen bruker begrepene positiv og negativ seleksjon til å beskrive migrasjonsstrømmer. At migranter er negativt selektert er ikke ensbetydende med at migrantene er et problem. Hvis et land har stort behov for arbeidskraft med lav formell kompetanse, kan det være en styrke at immigrasjonsstrømmen til landet hovedsakelig er negativt selektert.

(9)

2 Litteraturoversikt

Litteraturen på migrasjonsfeltet dekker mange aspekter ved migrasjon. Litteraturen ser blant annet på assimilasjon av immigranter, effekten av immigrasjon på lønninger og sysselsetting og kartlegging hva som kjennetegner immigrantene/emigrantene når det gjelder kompetanse.

Denne oppgaven skal analysere seleksjonsprosessen til norske emigranter. Altså hva som kjennetegner emigrantene når det gjelder kompetansenivå. Det er derfor vesentlig å se hva andre studier har funnet ut ved å studere emigrasjonen ut av Norge og Norden. Litteratur som studerer seleksjonsprosessen til emigranter flere steder i verden vil også være relevant, slik at en kan få et overblikk over hvor valid prediksjonene til Roy-modellen er. Jeg har også valgt å presentere litteratur som tar opp immigrasjon til Norge. Disse studiene har ikke fokus på å identifisere om immigrantene er en positivt eller negativt selektert gruppe. Disse studiene fokuserer hovedsakelig på hva arbeidsmarkeds- og trygdeutfallet til immigrantene er, og hvordan immigrasjonen påvirker lønningene til utsatte yrkesgrupper. Det eksisterer også offentlige utredninger som har undersøkt innvandringen til Norge.

2.1 Immigrasjon til Norge

Bratsberg et al. (2010) studerer arbeidsmarkedsutfallet til arbeidsimmigranter fra utviklingsland som ankom Norge på 1970-tallet. De finner at sysselsettingen blant denne gruppen faller bratt over tid. Bratsberg et al. (2010) mener det er to mekanismer som driver utviklingen i sysselsettingsraten blant immigrantene. Den første mekanismen er at immigrantene arbeidet i nedadgående industrier, og den andre er den generøse norske velferdsstaten.

I likhet med Bratsberg et al. (2010) studerer Bratsberg et al. (2014) arbeidsmarkedsutfallet til immigranter. Forskjellen er hovedsakelig at Bratsberg et al. (2014) studerer flere immigrantgrupper, og inkluderer flere tidsperioder. Studien til Bratsberg et al. (2014) finner at immigranter som kommer fra høy-inntektsland presterer godt i det norske arbeidsmarkedet og på nivå med etniske nordmenn. Videre finner de at immigranter fra lavinntektsland har lav sysselsettingsrate og høy andel på trygd sammenlignet med etniske nordmenn med like bakgrunnsvariabler.

Bratsberg og Raaum (2012) studerer hvordan lønningene til bygningsarbeidere ble påvirket av immigranter i perioden 1998-2005. De finner at en økning i andelen immigranter sysselsatt i bygningssektoren har en negativ effekt på lønningene til etniske nordmenn som jobber i

(10)

sektoren. Studien viser at lønnseffekten er ujevnt fordelt, hvor den største effekten er på arbeidere med lavest formell kompetanse.

Hoen (2020) studerer hvordan etniske nordmenn sine lønninger har blitt påvirket av den store immigrasjonsbølgen av øst-europeiske arbeidsimmigranter som ankom på 2000-tallet. Hoen (2020) finner at en økning i andelen med østeuropeiske immigranter i et spesifikk yrke har en negativ effekt på etniske nordmenn sine lønninger i det spesifikke yrket, relativt til etniske nordmenn som er i yrker hvor østeuropeiske immigranter ikke er særlig representert i.

Det eksisterer offentlige utredninger som har undersøkt innvandringen til Norge. De er kjent som Brochmann 1 (NOU 2011:7) og Brochmann 2 (NOU 2017:2). NOU (2011:7) undersøker spesielt hvordan innvandringen til Norge påvirker bærekraften til den norske velferdsmodellen.

NOU (2011:7) kommer med en rekke forslag på hvordan velferdsordningene kan tilpasses en situasjon med mer innvandring til Norge. NOU (2017:2) undersøker hvilke langsiktige konsekvenser høy innvandring kan skape med særlig vekt på flyktninger. NOU (2017:2) beskriver mulige strategier for hvordan Norge skal klare å integrere flyktninger på en god måte.

Videre viser NOU (2017:2) at immigranter som kommer fra land i Asia, Afrika og Øst-Europa er sterkt representert i mange næringer hvor det typisk er mange arbeidere med lav formell kompetanse. Det kan være en indikasjon på at mange immigranter som kommer til Norge har lav formell kompetanse. Det må presiseres at mange av immigrantene ikke har kommet som arbeidsimmigranter, men som flyktninger eller via familiegjenforening.

2.2 Emigrasjon ut av Norge og Norden

Abramitzky et al. (2012) tar for seg emigrasjonsstrømmen fra Norge til USA som foregikk i perioden 1850-1913. Abramitzky et al. (2012) finner at emigrantene fra urbane områder i Norge var negativt selektert fra populasjonen. De finner tvetydige resultater når de analyserer seleksjonsprosessen blant emigrantene fra rurale områder. Emigrantene fra de urbane områdene tilhørte den nedre delen av inntektsfordelingen. USA hadde på den tiden en mer sammenpresset inntektsfordeling enn Norge (Abramitzky et al. 2012). Negativ seleksjon fra de urbane områdene er i tråd med Roy-modellen.

Schröder (1996) viser at tilbøyeligheten til å emigrere økte med utdanningsnivået i de skandinaviske landene på 1980-tallet. Videre viser Schröder (1996) at relativt lavt utdannede

(11)

hovedsakelig emigrerte til andre nordiske land, mens de relativt høyt utdannede emigrerte til ikke-nordiske land i Europa eller andre rike OECD-land.

Pedersen et al. (2003) undersøker emigrasjonsstrømmen ut av Skandinavia i årene 1981, 1989 (1991 for Norge) og 1998. Emigrantutvalget til Pedersen et al. (2003) består av alle individer over 19 år som emigrerte fra de skandinaviske landene i de respektive årene. Ikke- emigrantutvalget består av et tilfeldig trukket utvalg fra populasjonen (individer over 19 år).

Pedersen et al. (2003) finner at sannsynligheten for å emigrere ut av Skandinavia øker med utdanningsnivået. Videre finner de en U-formet sammenheng mellom sannsynligheten for å emigrere og nivået på inntekten. Det er individer, som er utenfor eller marginalt i arbeidsstyrken, som dominerer i det laveste inntektsintervallet. Resultatene til Pedersen et al.

(2003) viser tydelig at sannsynligheten for å emigrere stiger med inntekten for dem som er veletablert i arbeidsstyrken.

Pedersen et al. (2008) studerer den norske emigrasjonsstrømmen ut av Norge i 1991 og 1998, hvor de skiller mellom emigranter som flytter til nordiske land og rike OECD-land. Utvalget deres omfatter individer med positiv inntekt som befant seg i aldersgruppen 20-65 år, og som var født i Norge. Pedersen et al. (2008) finner at sannsynligheten for å emigrere til et OECD- land utenfor for Norden er stigende med inntektsnivået, mens sannsynligheten for å emigrere til et nordisk land er synkende med inntektsnivået. Videre viser de at norske emigranter er yngre, har færre barn og har sjeldnere en partner. Studien viser at det er en positiv korrelasjon mellom utdanningsnivå og emigrasjon, hvor korrelasjonen er sterkest for emigranter som flytter til ikke-nordiske land.

Pirttilä (2004) studerer emigrasjonsstrømmen ut av Finland på 1990-tallet. Når det kontrolleres for en rekke bakgrunnsvariabler viser studien at høyt utdannede individer har fem ganger større sannsynlighet for å emigrere ut av Finland enn individer med bare videregående skole.

Borjas et al. (2019) studerer emigrasjonsstrømmen ut av Danmark i perioden 1996-2005.³ Utvalget deres omfatter etniske dansker som jobbet fulltid, og som tilhørte aldersgruppen 25- 54 år. Studien utforsker hvordan emigranter og ikke-emigranter skiller seg fra hverandre på

3 Borjas et al. (2019) bruker registerdata fra perioden 1995-2010, men deler emigrantene inn i gruppene korttids- og langtidsemigranter. Langtidsemigranter, etter Borjas et al. (2019) definisjon, er emigranter som bor i utlandet i minst fem år. For å kunne dele emigrantene inn i de to gruppene er bare individer som emigrerer til og med 2005 inkludert i analysen deres.

(12)

observerbare og uobserverbare karakteristikker.⁴ Når det gjelder observerbare karakteristikker fokuserer Borjas et al. (2019) på inntekten til individene, og de benytter residualer fra lønnsligninger (residuallønninger) til å undersøke hvorvidt emigrantene og ikke-emigrantene har forskjellig uobservert kompetanse. Det nye med denne studien er at de tester stokastisk dominans prediksjonen til Roy-modellen.⁵ Danmark har relativt lav avkastning av kompetanse, og prediksjonen til Roy-modellen er at Danmark hovedsakelig vil ha en positivt selektert emigrasjonsstrøm. De empiriske funnene til Borjas et al. (2019) viser at danske emigranter er positivt selektert på observerbare og uobserverbare karakteristikker. I analysen skiller Borjas et al. (2019) mellom emigranter som flytter til nordiske land og ikke-nordiske land, og mellom kjønn. Borjas et al. (2019) finner at begge emigranttypene er positivt selektert, men de finner en sterkere positiv seleksjon blant emigrantene som flytter til ikke-nordiske land.

2.3 Emigrasjon andre steder i verden

Parey et al. (2017) utforsker seleksjonsprosessen blant tyske emigranter med høy utdannelse ved å bruke predikert inntekt. De finner resultater som er konsistent med Roy-modellen.

Emigranter som flytter til land med mindre ulikhet enn Tyskland er negativt selektert, og emigranter som flytter til land med mer ulikhet er positivt selektert.

Gould og Moav (2016) analyserer emigrasjonsstrømmen ut av Israel, hvor de avgrenser analysen til kun å studere menn. De finner at sannsynligheten for å emigrere øker med utdanningsnivået. Videre finner de en invers u-formet sammenheng mellom emigrasjon og uobservert kompetanse. De benytter, i likhet med Borjas et al. (2019), residuallønninger som mål på uobservert kompetanse. De fleste emigrantene i studien flytter til USA, hvor avkastningen av kompetanse er høyere enn i Israel.

Det er flere studier som har analysert emigrasjonsstrømmen fra Mexico til USA. Chiquair og Hanson (2005) predikerer hvilken lønn meksikanere hadde i Mexico, før de emigrerte til USA, basert på deres observerbare karakteristikker i USA. Mexico har høyere avkastning av kompetanse enn USA, og Roy-modellen predikerer derfor en negativt selektert emigrasjonsstrøm fra Mexico til USA. Chiquiar og Hanson (2005) estimerer at de meksikanske emigrantene ikke tilhører den nedre delen av lønnsfordelingen i Mexico, men har en medium-

4 Hovedanalysen til Borjas et al. (2019) omfatter kun langtidsemigranter. En separat analyse av korttidsemigrantene finnes i appendikset til Borjas et al. (2019).

(13)

høy plassering i lønnsfordelingen. Fernandez-Huertas Moraga (2011) og Kaestner og Malamud (2014) bruker spørreskjema-data, som potensielt rapporterer den faktiske lønnen individene hadde i Mexico før de emigrerte til USA. De finner empiriske bevis på at emigrantene er negativt selektert på lønn fra den meksikanske populasjonen. Patt et al. (2021) undersøker hvordan meksikanere som emigrerer i USA er selektert på manuelle og kognitive ferdigheter.⁶ De finner at meksikanske emigranter har høyere manuelle og lavere kognitive ferdigheter enn meksikanske ikke-emigranter. Funnene er i tråd med det teoretiske rammeverket ettersom avkastningen av manuelle (kognitive) ferdigheter er høyere (lavere) i USA enn i Mexico (Patt et al. 2021).

Rosso (2019) studerer emigrasjonsstrømmen fra Polen til Storbritannia og Tyskland. Hun undersøker hvordan polske emigranter er selektert på observerbar (utdanningsnivå) og uobserverbar kompetanse (residuallønninger). Rosso (2019) estimerer at Polen har høyere avkastning på observerbar kompetanse enn Tyskland og Storbritannia, men finner at sannsynligheten for å emigrere fra Polen ikke faller med utdanningsnivået som Roy-modellen predikerer. Når det gjelder uobserverbar kompetanse finner Rosso (2019) funn som delvis samsvarer med prediksjonene til Roy-modellen.⁷

2.4 Oppsummering av litteraturoversikten

Litteraturen om immigrasjonen til Norge viser at ikke-vestlige immigranter presterer dårligere på arbeidsmarkedet enn innfødte nordmenn med like observerbare karakteristikker. Videre finner de at vestlige immigranter presterer godt på det norske arbeidsmarkedet (Bratsberg et al.

2010; Bratsberg et al. 2014). Andre studier studerer hvordan immigrasjonen påvirker innfødte sine lønninger. Hoen (2020) og Bratsberg og Raaum (2012) viser at immigrasjonen har en negativ effekt på enkelte yrkesgrupper sine lønninger.

Litteraturen, som utforsker emigrasjonen ut av Norden, får konsistente resultater. Oppsummert finner litteraturen at nordiske emigranter har mer utdanning og høyere inntekt enn ikke- emigrantene. Borjas et al. (2019) viser at danske emigranter har et høyere uobservert

6 Manuelle ferdigheter er for eksempel praktiske ferdigheter og fysisk styrke. Kognitive ferdigheter er for eksempel kreativitet og evne til problemløsning.

7 Rosso (2019) finner at seleksjonen på uobserverbar kompetanse til Storbritannia er konsistent med modellen, men ikke til Tyskland. Sannsynligheten for å emigrere til Storbritannia faller med nivået på den uobserverte kompetansen, mens sannsynligheten for å emigrere til Tyskland ikke øker med nivået på den uobserverte kompetansen. Rosso (2019) estimerer at Tyskland har høyere og Storbritannia har lavere avkastning av uobserverbar kompetanse enn Polen.

(14)

kompetansenivå enn ikke-emigrantene. Funnene til studiene er i tråd med prediksjonene til Roy-modellen, siden nordiske land har relativt lav avkastning av kompetanse.

Litteraturen om seleksjonsprosessen til emigranter andre steder i verden finner stort sett funn som er i tråd med prediksjonene til Roy-modellen. To av studiene, som ikke får resultater i tråd med det teoretiske rammeverket, studerer emigrasjonsstrømmer hvor teorien predikerer negativ seleksjon (Chiquair og Hanson 2005; Rosso 2019).

(15)

3 Teoretisk rammeverk

3.1 Positiv og negativ seleksjon

Vi fokuserer på den økonomiske beslutningen om å emigrere og i så fall hvor. Inntekten til et individ bestemmes av kompetansenivået og den avkastningen individet får av den i bostedslandet. En person vil ønske å flytte til utlandet hvis det gir høyere avkastning av kompetansen og flyttekostnadene blir dekket. Avkastningen av kompetanse er ulik mellom land. Det er derfor ikke tilfeldig hvem som tjener på å emigrere. Av den grunn vil vi på populasjonsnivå se positiv eller negativ seleksjon. Hvis emigrantene er positivt selektert tilhører de den øvre delen av kompetansefordelingen i hjemlandet, og den nedre delen av kompetansefordelingen hvis de er negativt selektert. To betingelser må være oppfylt for at positiv seleksjon skal skje: (a) Det må være en positiv korrelasjon mellom inntektsmulighetene i hjemlandet og destinasjonslandet. (b) Destinasjonslandet må ha en mer spredt inntektsfordeling enn hjemlandet. Dersom betingelse (a) er oppfylt, men ikke (b) vil negativ seleksjon være tilfellet (Borjas 1987). Inntektsulikheten i et land er en proxy på avkastningen av kompetanse (Borjas 2020).⁸ I dette rammeverket er det altså avkastningen av kompetanse som avgjør om emigrantene er positivt eller negativt selektert fra populasjonen, gitt at kompetanse er tilstrekkelig overførbart mellom land.

Norge har vært karakterisert ved en sammenpresset lønnsfordeling som impliserer at Norge har relativt lav avkastning av kompetanse (Bratsberg et al. 2014). Hanushek et al. (2015) viser også at Norge har lavere avkastning av kognitiv kompetanse enn en rekke OECD-land. Det teoretiske rammeverket predikerer dermed at emigrasjonsstrømmen ut av Norge hovedsakelig vil være positivt selektert. Det vil ikke nødvendigvis være lik seleksjon til alle land. I dette rammeverket er det forskjellen i avkastningen av kompetanse mellom hjemlandet og destinasjonslandet som avgjør hvilken seleksjon teorien predikerer. Hvis et land har høyere avkastning av kompetanse enn Norge vil teorien predikere positiv seleksjon, og negativ seleksjon hvis landet har lavere avkastning av kompetanse enn Norge. I USA er dette tydeligere. USA har en mer spredt

8 Når et land har liten spredning i inntektsfordelingen vil det indikere at landet har lav avkastning av kompetanse, siden det er små forskjeller mellom individer med ulikt kompetansenivå. Når inntektsulikheten øker vil det bety at inntektsforskjellen mellom individer med ulikt kompetansenivå stiger. Det taler for at inntektsulikhet kan brukes som en proxy på avkastningen av kompetanse i et land.

(16)

inntektsfordeling enn nordiske land. Nordiske emigranter som flytter til USA vil derfor typisk være positivt selektert. På den andre siden mottar USA negativt selekterte immigranter fra Latin- og Sør-Amerika, hvor inntektsulikheten er større enn i USA. I neste delkapittel gjør jeg rede for en formell framstilling av modellen for seleksjon av migranter, basert på Borjas et al.

(2019).

3.2 Roy-modellen

Borjas (1987) var den første til å anvende modellen til Roy (1951) til å analysere selv-seleksjon av migranter, og Borjas et al. (2019) tar utgangspunkt i denne. Roy-modellen beskriver positiv og negativ seleksjon. En implikasjon av modellen er at positivt selekterte emigranter vil ha høyere gjennomsnittlig kompetanse enn populasjonen i landet de emigrerer fra. Det nye i Borjas et al. (2019) er at de også viser at modellen impliserer at emigrantene sin kompetansefordeling vil førsteordens stokastisk dominere kompetansefordelingen til ikke-emigrantene når emigrantene er positivt selektert.

I modellen er det to land. Innbyggerne i hjemlandet (land 0) kan velge å bli værende eller emigrere til utlandet (land 1).⁹ Vi antar at beslutningen om å emigrere er irreversibelt. Videre ser vi bort fra flyttekostnader, og at det er forventet livtidsinntekt individene vil vurdere.

Innbyggerne i hjemlandet står overfor følgende inntektsfordeling¹⁰:

log 𝑤_& = 𝛼_&+ 𝑟_&𝑠 + 𝜀_& (1)

Hvor 𝑤_& er lønnen i hjemlandet, 𝑟_& er avkastningen på den observerte kompetansen og den tilfeldige variabelen 𝜀_& måler uobserverbare forhold som er antatt å være normalfordelt med forventning lik null og varians 𝜎_&^.. Hvis det er liten spredning i 𝜀_& vil det bety at lønnen til individene hovedsakelig avhenger av avkastningen på den observerte kompetansen. Jo større spredning det er i 𝜀_& desto mer avhenger lønnen til individene av uobserverbare forhold. Vi kan derfor tolke spredningen til den tilfeldige variabelen (residualen) 𝜀_& som prisen på uobservert kompetanse i land 0. Fordelingen av den observerbare kompetansen til populasjonen i hjemlandet er gitt ved 𝑠 = 𝜇₀+ 𝜀₁. Hvor den tilfeldige variabelen 𝜀₁ er antatt å være normalfordelt med forventning lik null og varians 𝜎₁^..

9 Roy (1951) studerer hvordan individer selekterer seg til ulike yrker.

10 For å forenkle modellen har Borjas et al. (2019) valgt å ikke ha med fotskrift i i modellen. Jeg velger å gjøre det

(17)

Hvis hele populasjonen i hjemlandet (land 0) emigrerte til utlandet (land 1) vil denne populasjonen stå overfor følgende inntektsfordeling:

log 𝑤₂ = 𝛼₂+ 𝑟₂𝑠 + 𝜀₂ (2)

Hvor den tilfeldige variabelen 𝜀₂ er antatt å være normalfordelt med forventning lik null og varians𝜎₂^.. Vi antar at Cov(𝜀_&, 𝜀₁) = Cov(𝜀₂, 𝜀₁) = 0. Det betyr at uobservert kompetanse er ukorrelert med observert kompetanse.¹¹ Korrelasjonskoeffisienten mellom 𝜀_& og 𝜀₂ er 𝜌_&2. Den tilfeldige variabelen 𝜀₁ er individspesifikk og har samme verdi for et individ i begge landene.

𝜀_& og 𝜀₂ er både individ- og landspesifikk.

Vi antar at ligning (1) og (2) beskriver inntektsmulighetene til et individ født i hjemlandet (land 0) fullstendig. Videre antar vi at en beslutning om å emigrere avhenger av forskjellen i avkastningen av observert og uobservert kompetanse mellom de to landene.¹² Basert på ligning (1) og (2) definerer vi indeksfunksjonen:

𝐼 = log ;𝑤₂

𝑤_&< ≈ [(𝛼₂ − 𝛼_&) + (𝑟₂− 𝑟_&)𝜇₁] + [(𝑟₂𝜀₁ + 𝜀₂) − (𝑟_&𝜀₁ + 𝜀_&)]

= ∆𝜇 + (𝑣₂ − 𝑣_&)

(3)

Inntektsforskjellen mellom de to landene for et individ med gjennomsnittlig observert og uobservert kompetanse er gitt ved ∆𝜇 = [(𝛼₂− 𝛼_&) + (𝑟₂− 𝑟_&)𝜇₁]. Forskjellen i inntekt som skyldes individuelle avvik fra gjennomsnittlig kompetanse er gitt ved (𝑣₂− 𝑣_&), hvor 𝑣_C = (𝑟_C𝜀₁+𝜀_C) for i ∈ {0, 1}. En person emigrerer hvis, og bare hvis, indeksen I > 0.

11 En mer realistisk antakelse ville vært å anta positiv korrelasjon mellom observert og uobservert kompetanse. En antakelse om positiv korrelasjon ville ikke endret de kvalitative prediksjonene til modellen.

12 Flyttekostnaden til et individ er med på å avgjøre flyttebeslutningen til individet, men flyttekostnaden påvirker ikke seleksjonen modellen predikerer på populasjonsnivå hvis flyttekostnaden er konstant mellom individene eller ukorrelert med kompetanse (Borjas (1987); Chiquiar og Hanson (2005)). Flyttekostnaden er tatt ut av modellen for enkelhets skyld.

(18)

Figur 1

Figur 1 er en enkel illustrasjon av forholdet mellom inntekt og kompetanse i henholdsvis land 0 og 1. Figuren illustrerer et scenario der land 1 har høyest avkastning av kompetanse (inntektsulikheten er større). Individer i land 0 med kompetanse til venstre for 𝑆_J får lavere inntekt i land 1, og individer i land 0 med kompetanse til høyre for 𝑆_J får høyere inntekt i land 1. Individene i land 0 som tjener på å emigrere til land 1 tilhører den øvre delen av kompetansefordelingen. Det betyr at de er positivt selektert. En illustrasjon av negativ emigrantseleksjon er vist i appendikset.

Modellen skiller mellom seleksjon på observert og uobservert kompetanse. La 𝐹_L(𝑧) og 𝐹_N(𝑧) representere den kumulative fordelingsfunksjonen av kompetanse for emigranter og ikke- emigranter i hjemlandet (land 0), hvor 𝑧 er et mål på kompetanse. Den kumulative fordelingsfunksjonen til emigrantene 𝐹_L(𝑧) førsteordens stokastisk dominerer fordelingen til ikke-emigrantene 𝐹_N(𝑧) hvis:

𝐹_L(𝑧) ≤ 𝐹_N(𝑧) ∀𝑧 (4)

og det er minst en verdi av 𝑧 hvor streng ulikhet holder. Ligning (4) impliserer at en større andel av emigrantene har kompetanse over enhver terskelverdi 𝑧^∗. Med andre ord, for ethvert nivå med kompetanse 𝑧^∗, så har emigrantene alltid en større andel med kompetanse over terskelverdien 𝑧^∗ enn ikke-emigrantene. Grafisk vil dette si at den kumulative

(19)

fordelingsfunksjonen til emigrantene ligger til høyre for fordelingen til ikke-emigrantene over hele fordelingen. Vi kan si at emigrantene er positivt selektert uansett hva en setter som terskelverdi. Dette er intuisjonen bak stokastisk dominans prediksjonen til Roy-modellen.

Negativ seleksjon ville vært tilfellet dersom 𝐹_N(𝑧) ≤ 𝐹_L(𝑧) ∀𝑧, hvor streng ulikhet holder for minst en verdi av 𝑧. Det kan vises at:

𝐹_L(𝑧) < 𝐹_N(𝑧) hvis 𝜌 > 0 𝐹_L(𝑧) > 𝐹_N(𝑧) hvis 𝜌 < 0

(5)

hvor 𝜌 er den relevante korrelasjonskoeffisienten. Emigrantene er positivt selektert når 𝜌 > 0, og er negativt selektert når 𝜌 < 0. Borjas et al. (2019) viser at når det gjelder observerbar kompetanse er den relevante korrelasjonskoeffisienten for den stokastiske rangeringen av kompetansefordelingen til emigrantene og ikke-emigrantene gitt ved:

𝜌 = Corr(𝜀₁, 𝑣₂− 𝑣_&) = 𝑟_&𝜎₁ 𝜎_W ;𝑟₂

𝑟_&− 1< (6)¹³

Ligning (6) viser at den stokastiske rangeringen av fordelingene kun avhenger av de internasjonale forskjellene i avkastningen av observerbar kompetanse. Den kumulative fordelingsfunksjonen av observert kompetanse til emigrantene førsteordens stokastisk dominerer fordelingen til ikke-emigrantene når avkastningen av observerbar kompetanse er høyere i utlandet. Dersom avkastningen er høyere hjemme, vil det motsatte være tilfellet.

Når det gjelder uobserverbar kompetanse kan det vises at den relevante korrelasjonskoeffisienten for den stokastiske rangeringen av kompetansefordelingen til emigrantene og ikke-emigrantene er gitt ved:

𝜌 = Corr(𝜀_&, 𝑣₂− 𝑣_&) =𝜎_&

𝜎_W;𝜌_&2𝜎₂

𝜎_& − 1< (7)¹⁴

Den kumulative fordelingsfunksjonen av uobserverbar kompetanse til emigrantene førsteordens stokastisk dominerer fordelingen til ikke-emigrantene når 𝜌_&2^X_X^Y

Z > 1. Hvis denne

13 𝜎_W = [𝑣𝑎𝑟 (𝑣₂− 𝑣_&).𝑟_& og 𝑟₂ er avkastningen av observert kompetanse i henholdsvis land 0 og 1. 𝜎₁ er standardavviket til 𝜀₁.

14𝜎_& og 𝜎₂ er standardavviket til henholdsvis 𝜀_& og 𝜀₂, og 𝜌_&2 er korrelasjonskoeffisienten mellom 𝜀_& og 𝜀₂.

(20)

betingelsen er oppfylt vil emigrantene være positivt selektert på uobservert kompetanse.

Betingelsen har to komponenter. For det første må uobserverbar kompetanse være tilstrekkelig overførbart mellom landene, slik at 𝜌_&2 er høy. For det andre må variansen til 𝜀₂ være større enn variansen til 𝜀_&. Når variansen til 𝜀₂ er større enn variansen til 𝜀_& vil det indikere at avkastningen av uobserverbar kompetanse er høyere i utlandet. Gitt at avkastningen av uobservert kompetanse er høyere i utlandet vil emigrantene være positivt selektert på uobservert kompetanse hvis korrelasjonskoeffisienten 𝜌_&2 er tilstrekkelig høy.

Inntektsfordelingen avhenger av både observert og uobservert kompetanse, slik at stokastisk dominans i inntektsfordelingen kombinerer de to elementene vi har sett på til nå.

Inntektsfordelingen i hjemlandet som er gitt ved ligning (1) kan skrives om til:

log 𝑤_& = (𝛼_&+ 𝑟_&𝜇₁) + (𝑟_&𝜀₁+ 𝜀_&) = (𝛼_&+ 𝑟_&𝜇₁) + 𝑣_& (8)

Hvor den tilfeldige variabelen 𝑣_& er antatt å være normalfordelt med forventning lik null og varians 𝜎_W&^. .

Det kan vises at den relevante korrelasjonskoeffisienten, når det gjelder den stokastiske rangeringen av inntektsfordelingen til emigrantene og ikke-emigrantene, er gitt ved:

𝜌 = Corr(𝑣_&, 𝑣₂− 𝑣_&) =𝜎_W&

𝜎_W ]𝛾 ;𝑟₂

𝑟_&− 1< + (1 − 𝛾) ;𝜌_&2𝜎₂

𝜎_& − 1<_

hvor 𝛾 =^`^Z^a^X^b^a

X_cZ^a og 1 − 𝛾 = ^X^Z^a

X_cZ^a

(9)

Fortegnet på korrelasjonskoeffisienten i ligning (9), som bestemmer seleksjonen på inntekt, avhenger av fortegnet på et vektet gjennomsnitt av seleksjonen som forekommer på observert og uobservert kompetanse. Vektingen bestemmes av hvilken grad de to kompetansetypene bidrar til å skape varians i inntektsfordelingen. Dersom det er positiv (negativ) seleksjon på både observerbar og uobserverbar kompetanse vil det også være positiv (negativ) seleksjon på inntekt. Hvis det derimot er forskjellig type seleksjon i de to typene med kompetanse, blir seleksjonen på inntekt bestemt av det vektete gjennomsnittet av de to kompetansetypene.

Observerbare egenskaper forklarer stort sett lite av variansen i inntektsfordelingen (Borjas et

(21)

al. 2019; Lemieux 2006).¹⁵ Det impliserer at seleksjonen på uobserverbar kompetanse må være viktig for hvordan emigrantene er selektert på inntekt.

Modellen inneholder mange ukjente parametere, som bestemmer seleksjon og stokastisk dominans. For å undersøke alle sider av modellen vil vi trenge data om både avsender- og destinasjonsland. Det har vi typisk ikke. Modellen gir likevel noen prediksjoner som kan sjekkes for å undersøke om modellen er god. Ved positiv seleksjon skal emigrasjon være positivt korrelert med utdanning og inntekt i avsenderlandet. Det kan sjekkes ved å se på gjennomsnittsverdier for emigranter og ikke-emigranter. I tillegg kommer stokastisk dominans prediksjonen til modellen. Resten av oppgaven vil hovedsakelig handle om å undersøke disse prediksjonene på norske data.

15 I en lønnsligning vil variasjon i observert kompetanse (og andre observerte egenskaper) stort sett forklare lite av variasjonen i inntekt.

(22)

4 Data og utvalgsdesign

4.1 Data

Oppgaven bygger på registerdata fra Statistisk sentralbyrå (SSB) sin database FD-trygd.

Statistikkloven pålegger offentlige institusjoner til å sende inn statistikk til SSB (Statistikkloven, § 10, 2019). Det medfører at inntektsopplysninger, informasjon om bakgrunnsvariabler og flyttebevegelser blir rapport inn til SSB. For at denne oppgaven skal kunne rapportere troverdige resultater, er jeg avhengig av at emigrasjon ut av Norge blir rapportert inn til myndighetene. Det er mulig å emigrere ut av Norge uten å melde ifra. Det er grunn til å tro at det gjelder få individer, ettersom det er lovpliktig å melde inn flyttebevegelser til norske skattemyndigheter når utenlandsoppholdet har en varighet på seks måneder eller mer.

En er også pliktig til å melde ifra til myndighetene når man flytter tilbake til Norge (Folkeregisterloven, § 8, 1970; Folkeregisterloven, § 6-3, 2016).

Individene er identifisert med en personlig ID i registerdataene. Det medfører at statistikk fra mange ulike registre kan kobles sammen. Registerdataenes viktigste fortrinn sammenlignet med utvalgsundersøkelser er at registerdataene ikke har frafall, de fanger opp hele befolkningen og opplysningene er objektive. Registerdata er dermed et svært godt utgangspunkt for statistisk analyse. Registerdataene er ikke nødvendigvis helt feilfrie. Det kan være problemer med manglende registreringer, og kvaliteten på registreringene kan variere med anvendelsesgraden hos dataeierne (Raaum et al. 2012).

Registerdataene jeg har til rådighet var utlevert til Institutt for økonomi ved UiB i et tidligere prosjekt og er siden anonymisert slik at studenter kan benytte dataene. Flere variabler har blitt aggregert slik at individer ikke kan bli gjenkjent. Variablene i datasettet som er aggregert er variabler for inntekt, utdanning og destinasjonsland. I det anonymiserte datasettet oppgis årlig inntekt i enheter, hvor 50 000 kr er en enhet, og inntekten er trunkert nedover.¹⁶ Destinasjonslandene til emigrantene er slått sammen til ni geografiske områder.¹⁷ Videre

16 Under aggregeringen har Institutt for økonomi ved UiB trunkert inntektsvariablene nedover. Årlig inntekt under 50 000 kr blir registrert som 0 kr, årlig inntekt fra 50 000 kr til 99 999 kr blir registrert som 50 000 kr og årlig inntekt fra 100 000 kr til 149 999 kr blir registrert som 100 000 kr. Slik er gangen i trunkeringen av inntektsvariablene. Inntektsvariablene har en toppkoding på 1 million (før deflatering). Det innebærer at observasjoner med årlig inntekt på over 1 million blir registrert som at de har 1 million i årlig inntekt (før deflatering).

17 De ni geografiske områdene er Norden, Vest-Europa, Øst-Europa, Midtøsten (inkludert Tyrkia), Sentral-Asia,

(23)

medfører anonymiseringen at jeg ikke kan se den spesifikke utdanningen til individet, men utdanningsnivå og utdanningsgruppe på et overordnet nivå (av SSBs 6-sifrete kode er de 3 første beholdt). Det er også gjort en del aggregering av datovariabler.

Det viste seg at en del emigranter har ukjent destinasjonsland i datasettet. Det er totalt 18 551 emigranter i utvalget, hvor rundt 25 % av disse har ukjent destinasjonsland. Årsaken til denne mangelfulle kvaliteten i datasettet kjenner jeg ikke. Det medfører at jeg ikke kan bruke variabelen som angir hvilket geografisk område emigrantene flytter til når jeg skal analysere seleksjonsprosessen til dem.

4.2 Utvalgsdesign

Datasettet, oppgaven benytter, inneholder årlige observasjoner fra perioden 1993-2003 av norskfødte individer uten innvandrerbakgrunn i alderen 25-54 år.¹⁸ Utvalgsdesignet mitt er forholdsvis likt det Borjas et al. (2019) anvender. Innvandrere utelukkes for å unngå at analysen blir preget av innvandrere som tilbakevendte til sine hjemland. Innvandrere har ofte en sterk tilknytning til et annet land. Motivet for å emigrere kan derfor være knyttet til andre grunner enn for å oppnå høyere avkastning av sin kompetanse.

Roy-modellen predikerer at det er avkastningen av kompetanse som avgjør seleksjonen blant emigrantene. Det er derfor vesentlig at individene som inkluderes i analysen hadde en tilknytning til arbeidsmarkedet, og helst ikke en for svak tilknytning. Inntektsopplysningene til individer som jobber deltid viser ikke nødvendigvis det sanne inntektspotensialet til disse individene (Borjas et al. 2019). Av den grunn ville det vært ideelt om jeg kunne avgrense analysen til individer som jobbet fulltid, eller bortimot fulltid. Jeg har ikke data på arbeidstiden til individene. Av den grunn utføres en inntektsavgrensning for å luke ut individer (observasjoner) som hadde svak tilknytning til arbeidsmarkedet. Kapitalinntekter og noen typer overføringer er ikke direkte knyttet til hvilken inntekt et individ oppnår på arbeidsmarkedet.

Lønnsinntekten til et individ omfatter ikke næringsinntekter individet har. Derfor bruker jeg yrkesinntekt som mål på individenes inntekt i denne oppgaven. Yrkesinntekten er summen av lønnsinntekter og netto næringsinntekter i løpet av et kalenderår. Sykepenger og fødselspenger er inkludert (SSB 2021b). Videre i oppgaven vil yrkesinntekt bli omtalt som inntekt.

18 Datasettet jeg fikk utdelt av Institutt for økonomi ved UiB strekker seg over perioden 1993-2008. Jeg skiller mellom korttids- og langtidsemigranter i deler av analysen. En langtidsemigrant bor i utlandet i minst fem år. For å kunne klassifisere en emigrant som korttids- eller langtidsemigrant, må jeg ha kontroll på om emigrantene har tilbakevendt før det har gått fem år. Av den grunn kan jeg kun bruke emigrasjonsdata til og med 2003.

(24)

For å få et rimelig kriterium for en inntekt som indikerer fulltidsinntekt, tar jeg utgangspunkt i SSBs gjennomsnittsinntekt for fulltidsarbeidere i første desil i lønnsfordelingen i 1997, som er det første året jeg fant denne gjennomsnittsinntekten i SSBs statistikkbank (SSB 2021a).¹⁹ I 2015-kroner er dette 222 043. Under anonymiseringen ble inntektsvariablene aggregert og trunkert nedover. På grunn av denne trunkeringen velger jeg å runde av inntektskriteriet nedover. Jeg inkluderer derfor individer i det enkelte året hvis de har inntekt over 200 000 i 2015-kroner.²⁰

I likhet med Borjas et al. (2019) avgrenses utvalget til individer som tilhører aldersspennet 25- 54 år. Inklusjonskriteriet fungerer på den måten at observasjonene til et individ er inkludert i utvalget i de årene individet befant seg i aldersspennet 25-54 år. Dette aldersspennet blir omtalt av OECD som «gullaldersårene» når det gjelder deltakelse på arbeidsmarkedet. Individer under 25 år er på vei inn i arbeidsstyrken og individer over 54 år har gjerne oppnådd toppen av karrieren og nærmer seg pensjonsalderen (OECD 2021). I denne sammenhengen vil jeg si det er viktigst at en ekskluderer unge mennesker i tidlig 20-årene. Mange unge mennesker er under utdanning, eller planlegger å ta en utdannelse. En beslutning om å emigrere kan derfor være drevet av andre faktorer enn for å oppnå høyere avkastning på sin nåværende kompetanse. For eksempel at unge mennesker flytter til utlandet for å studere. Til slutt vil jeg presisere at emigranter som tilbakevendte til Norge ikke blir inkludert i utvalget igjen.

Det opprinnelige datasettet inneholdt 17 047 869 observasjoner, og 2 166 474 individer, for den relevante aldersgruppen.²¹ Alle observasjoner med ugyldig informasjon om bakgrunnsvariabler ble fjernet fra datasettet. Observasjonene som ble fjernet var de med negativ yrkesinntekt, manglende data om familiestatus og de som er registrert med null års utdanning. 1939-kullet ble også fjernet, siden individer fra det årskullet viste seg å mangle data om inntekt. Antall observasjoner ble redusert til 16 393 464 (2 070 587 individer) på grunn av dette. Videre reduserte inntektsavgrensningen antall observasjoner til 10 819 802 (1 673 276 individer). Før

19 En for høy inntektsavgrensing kan medføre at individer som jobbet fulltid, og tilhørte den nedre delen av lønnsfordelingen, blir ekskludert fra utvalget. På den andre siden vil en for lav inntektsavgrensning medføre at individer som hadde svak tilknytning til arbeidsmarkedet blir inkludert i utvalget. Jeg mener det er mest problematisk å ende opp med å ekskludere individer med svært lave lønninger, men som jobbet fulltid eller bortimot fulltid. Derfor tar jeg utgangspunkt i første desil av lønnsfordelingen.

20Ettersom jeg runder av nedover har det ikke noe å si om jeg har en felles eller separat inntektsgrense for menn og kvinner, siden det er liten forskjell mellom menn og kvinner i første desil av lønnsfordelingen i 1997.

21 Datasettet var allerede avgrenset på alder og innvandrerbakgrunn da jeg mottok datasettet fra Institutt for

(25)

inntektsavgrensningen er 50,91 % av observasjonene menn, og 49,09 % er kvinner. Etter inntektsavgrensninger er 61,73 % av observasjonene menn og 38,27 % er kvinner.²²

Oppsummert består mitt utvalg av observasjoner med en alder i spennet 25-54 år, med en inntekt på 200 000 eller mer (2015-kroner), og uten en innvandrerbakgrunn. Det blir totalt 10 819 802 observasjoner fordelt over årene 1993-2002. Variabelen som angir om et individ emigrerer angir emigrasjon påfølgende år, fordi vi ikke har fullstendige inntektsdata det året individet emigrerer. Emigrasjonsvariabelen viser derfor emigrasjon fra og med 1994 til og med 2003. Andre variabler er målt fra og med 1993 til og med 2002.

4.3 Deskriptiv statistikk

Ettersom en del emigranter har ukjent destinasjonsland vil hovedanalysen fokusere på forskjellene mellom emigranter og ikke-emigranter. Jeg undersøker også hvorvidt korttids- og langtidsemigranter skiller seg fra hverandre.²³ Jeg følger Borjas et al. (2019) når jeg deler emigrantene inn i de to gruppene. En korttidsemigrant bor i utlandet i mindre enn fem år, og en langtidsemigrant bor i utlandet i fem år eller mer. Ifølge NOU (2008:6) er norsk arbeidsliv preget av å være kjønnssegregert, det vil si at menn og kvinner arbeider i ulike sektorer og i ulike yrker. Med bakgrunn i at menn og kvinner har ulik atferd på arbeidsmarkedet vil det være naturlig å studere dem separat. Jeg bruker standardisert inntekt i deler av analysen for å ta hensyn til års- og alderseffekter. Den standardiserte inntekten er forholdstallet mellom et individ sin inntekt og gjennomsnittlig inntekt til individer med lik alder og kjønn i et kalenderår.

Standardisert inntekt = ^d_d_i^efgh

fgh. 𝑤_Cjkl er inntekt til individ i i kalenderår t som tilhører alder k og kjønn j. 𝑤i_jkl er gjennomsnittlig inntekt til individer med alder k og kjønn j i kalenderår t.

Standardiseringen av inntekten ble utført etter at observasjoner med ugyldig informasjonom bakgrunnsvariabler ble fjernet fra datasettet. Inntektsavgrensningen ble gjennomført etter standardiseringen av inntekten.

22 I kapittel A.7 vises en sensitivitetsanalyse for kvinner hvor inntektsgrensen er satt til 150 000 2015-kroner.

Resultatene til sensitivitetsanalysen viser samme mønster som hovedanalysen.

23 Borjas og Bratsberg (1996) viser empirisk og teoretisk at kompetansekomposisjonen til emigranter som tilbakevender til sine hjemland avhenger av hvilken type seleksjon som var tilfellet i første omgang. Det kan derfor være interessant å undersøke om det er forskjeller mellom korttids- og langtidsemigranter i denne oppgaven.

(26)

Tabell 1

Deskriptiv statistikk for menn

Alle Ikke-

emigranter

Emigranter Korttids- emigranter

Langtids- emigranter Observasjoner 6 678 597 6 666 868 11 729 7 654 4 075 Alder

Gjennomsnitt 39,56 39,57 36,97 36,91 37,09

Median 40 40 36 36 35

Årlig inntekt

Gjennomsnitt 8,31 8,30 10,82 11,03 10,42

Median 7,33 7,33 9,27 10,01 8,89

Standardisert årlig inntekt

Gjennomsnitt 1,20 1,20 1,61 1,65 1,54

Median 1,07 1,07 1,46 1,52 1,35

Utdanning (år)

Gjennomsnitt 13,06 13,06 15 15,42 14,23

Median 13 13 15 16 14

Utdanningsgrupper (%)

Grunnskole 19,70 19,71 9,34 7,15 13,45

VGS, studieforberedende 8,46 8,46 8,39 7,73 9,62

VGS, yrkesfag 39,53 39,57 18,52 15,34 24,49

Fagskole 4,76 4,76 5 4,64 5,67

Bachelor og tilsvarende 19,08 19,06 31,69 33,17 28,91

Master og tilsvarende 7,93 7,90 24,19 28,26 16,54

Forskerutdanning (PhD) 0,55 0,55 2,88 3,71 1,33

Merknad: Årlig inntekt måles i enheter, hvor en enhet er 50 000 kr. Årlig inntekt er deflatert til 2015-kroner. De to første kolonnene angir observasjoner, og de tre siste angir individer. En beskrivelse av inndelingen av utdanningskategoriene finnes i appendikset.

Tabell 1 viser deskriptiv statistikk for menn. De to første kolonnene angir observasjoner, og de tre siste kolonnene angir individer. Datasettet er satt opp slik at et individ blir registrert som en ikke-emigrant helt til individet eventuelt emigrerer. Dummyvariabelen som viser om et individ emigrerer tar verdien 1 året før individet emigrerer, og 0 alle tidligere år. Det vil si at datagrunnlaget for emigrantene er basert på data fra året før emigrantene emigrerer, mens datagrunnlaget for ikke-emigrantene er basert på data for alle individer som ikke emigrerer påfølgende år. Det er totalt 946 659 mannlige individer i utvalget. Basert på inklusjonskriteriene finner jeg at 11 729 av disse emigrerer i løpet av perioden. 7 654 av emigrantene er korttidsemigranter, og 4 075 er langtidsemigranter.

(27)

De mannlige emigrantene er yngre enn ikke-emigrantene. Det passer godt overens med økonomisk teori at emigrantene er yngre. Yngre mennesker vil i større grad få en positiv netto migrasjonsfortjeneste av å emigrere siden de har et lengre yrkesliv foran seg. Dermed har de flere år å høste gevinst av og dele flyttekostnadene på (Boeri og Van Ours 2013). Yngre mennesker vil trolig ha lavere flyttekostnader ettersom de har et mindre etablert privatliv.

Videre viser tabell 1 at mannlige emigranter har høyere inntekt, både standardisert og ikke- standardisert, enn ikke-emigrantene. Det samme mønsteret gjelder for utdanning, hvor emigrantene har i gjennomsnitt nesten to år lengre utdanning enn ikke-emigrantene. Tabellen presenterer også utdanningsfordelingen hvor det fremkommer at 27,51 % av ikke-emigrantene har bachelorgrad eller høyere. For emigrantene samlet er andelen henholdsvis 58,76 %.

Tabell 2

Deskriptiv statistikk for kvinner

Alle Ikke-

emigranter

Emigranter Korttids- emigranter

Langtids- emigranter Observasjoner 4 141 205 4 134 383 6 822 4 571 2 251

Alder

Gjennomsnitt 39,77 39,78 35,6 35,67 35,47

Median 40 40 34 34 33

Årlig inntekt

Gjennomsnitt 6,16 6,16 6,86 6,87 6,85

Median 5,72 5,72 6,09 6,09 6,09

Standardisert årlig inntekt

Gjennomsnitt 1,57 1,57 1,84 1,85 1,80

Median 1,45 1,45 1,67 1,69 1,61

Utdanning (år)

Gjennomsnitt 13,40 13,40 14,9 15,22 14,26

Median 13 13 15 16 14

Utdanningsgrupper (%)

Grunnskole 15,84 15,85 7,93 5,95 11,95

VGS, studieforberedende 13,75 13,75 10,39 8,95 13,33

VGS, yrkesfag 27,99 28,01 14,86 12,89 18,88

Fagskole 3,04 3,03 3,34 3,15 3,73

Bachelor og tilsvarende 33,84 33,82 47,52 50,91 40,65

Master og tilsvarende 5,31 5,30 15,02 17,00 11,02

Forskerutdanning (PhD) 0,23 0,23 0,92 1,16 0,44

Merknad: Årlig inntekt måles i enheter, hvor en enhet er 50 000 kr. Årlig inntekt er deflatert til 2015 kroner. De to første kolonnene angir observasjoner, og de tre siste angir individer. En beskrivelse av inndelingen av utdanningskategoriene finnes i appendikset.

(28)

Tabell 2 viser deskriptiv statistikk for kvinner. De to første kolonnene angir observasjoner, og de tre siste kolonnene angir individer. Det er totalt 726 617 kvinnelige individer i utvalget.

Basert på inklusjonskriteriene finner jeg at 6 822 av disse emigrerer i løpet av perioden. 4 571 av emigrantene er korttidsemigranter, og 2 251 er langtidsemigranter.

Den deskriptive statistikken for kvinnene har samme mønster som den til mennene. Kvinnelige emigranter er yngre og har høyere inntekt og utdanningsnivå enn ikke-emigranter. 39,35 % av de kvinnelige ikke-emigrantene har utdanning på bachelornivå eller høyere. Det er noe høyere enn for mennene hvor 27,51 % av ikke-emigrantene hadde bachelorgrad eller høyere. 63,46 % av de kvinnelige emigrantene har bachelorgrad eller høyere.

Kvinnene er på et høyere nivå på den standardiserte inntekten enn mennene når en sammenligner samme emigrantkategori mellom kjønnene. Grunnen til disse forskjellene skyldes inntektsavgrensningen. Gjennomsnittsinntekten (ikke-standardisert inntekt) til kvinnene er lavere enn gjennomsnittsinntekten til mennene. Inntektsavgrensningen medfører derfor at flere kvinner enn menn blir fjernet fra utvalget. Gjennomsnittsinntekten som er brukt til å regne ut kvinnenes standardiserte inntekt er lavere enn den som er brukt til å regne ut mennenes standardiserte inntekt. En felles inntektsavgrensning fører derfor til at kvinnene sin standardiserte inntekt blir «høyere» enn mennene sin.

Oppsummert viser den deskriptive statistikken i tabell 1 og 2 at emigrantene har mer utdanning og inntekt og lavere gjennomsnittsalder enn ikke-emigrantene. Korttidsemigrantene skiller seg ut som gruppen med høyest inntekts- og utdanningsnivå. Den deskriptive statistikken gir en klar indikasjon på at emigrantene er positivt selektert fra populasjonen.

Datasettet oppgaven benytter er et ubalansert panel. Tabell 3 og 4 gir en oversikt over panelet for henholdsvis menn og kvinner. I tabellene fremkommer det hvor mange individer som er med i panelet i hvert år, hvor det skilles mellom om individet er en ikke-emigrant eller emigrant.

I tillegg gir tabellene en oversikt over andelen av individene som emigrerte i et år. Andelen emigranter avtar noe over tid for begge kjønn.

(29)

Tabell 3

Oversikt over panelet for menn

År Antall

individer

Antall individer, ikke-

emigranter

Antall individer, emigranter

Emigranter %

1993 601 031 599 937 1 094 0,18

1994 635 355 634 224 1 131 0,18

1995 656 939 655 684 1 255 0,19

1996 674 199 672 814 1 385 0,21

1997 693 327 692 025 1 302 0,19

1998 709 978 708 806 1 172 0,17

1999 711 013 709 644 1 369 0,19

2000 667 097 665 977 1 120 0,17

2001 667 244 666 226 1 018 0,15

2002 662 414 661 531 883 0,13

Merknad: Variabelen som angir om et individ emigrerer angir emigrasjon påfølgende år. For eksempel de som er registrert som en emigrant i 1993 emigrerer i 1994.

Tabell 4

Oversikt over panelet for kvinner

År Antall

individer

Antall individer, ikke-

emigranter

Antall individer, emigranter

Emigranter %

1993 324 622 323 982 640 0,20

1994 356 589 355 962 627 0,18

1995 382 436 381 765 671 0,18

1996 412 363 411 559 804 0,19

1997 441 477 440 646 831 0,19

1998 478 531 477 821 710 0,15

1999 501 398 500 546 852 0,17

2000 387 629 387 019 610 0,16

2001 415 378 414 808 570 0,14

2002 440 782 440 275 507 0,12

Merknad: Variabelen som angir om et individ emigrerer angir emigrasjon påfølgende år. For eksempel de som er registrert som en emigrant i 1993 emigrerer i 1994.

(30)

5 Metode

I kapittel 3 ble stokastisk dominans prediksjonen til Roy-modellen gjort rede for. Modellen skiller mellom observert og uobservert kompetanse. Modellen viser at seleksjonen på en kompetansetype alene bestemmes av forskjeller i avkastningen av den kompetansetypen mellom landene. Det kan derfor være ulik seleksjon på observert og uobservert kompetanse.

Dersom emigrantene er positivt selektert på en kompetansetype predikerer modellen at emigrantene sin kumulative kompetansefordeling skal førsteordens stokastisk dominere fordelingen til ikke-emigrantene. Inntektsfordelingen avhenger av både observert og uobservert kompetanse, slik at stokastisk dominans i inntektsfordelingen kombinerer de to kompetansetypene.

Jeg skal undersøke hvordan emigrantene er selektert på observert og uobservert kompetanse samt inntekt. Antall år med utdanning rapporteres i hele tall, og det er store opphopninger på enkelte år. En kumulativ fordelingsfunksjon med antall år med utdanning som variabel blir derfor vanskelig å tolke siden vi ikke får s-formede fordelinger. Jeg vil derfor fokusere på inntekt og uobservert kompetanse når jeg tester stokastisk dominans prediksjonen til Roy- modellen. For å analysere seleksjon på observert kompetanse bruker jeg en regresjonsmodell til å utforske hvordan utdanningsnivå og emigrasjon henger sammen. Det er bare i analysen av observert og uobservert kompetanse jeg bruker regresjonsmodeller. Til analysen av seleksjon på inntekt vises de kumulative inntektsfordelingene til emigrantene og ikke-emigrantene for å undersøke hvordan emigrantene er selektert på inntekt.

5.1 Seleksjon på observerbar kompetanse

Jeg ønsker å undersøke hvordan utdanningsnivå og tilbøyeligheten til å emigrere henger sammen. En regresjonsmodell med emigrasjonsstatus som avhengig variabel vil være en diskret valgmodell, ettersom emigrasjonsstatus er en binær variabel som tar verdien 0 eller 1. Jeg velger å estimere denne med logistisk regresjon. Koeffisientene til logit-modellen er vanskelig å tolke direkte, derfor regnes koeffisientene om til marginaleffekter når resultatene rapporteres. Jeg estimerer følgende ligning:

𝑃𝑟n𝑌_Cj = 1p𝐗_Cj, ∑^st_ku.s𝛼_Cjk ,𝜂_j w = 𝐹(𝛾𝐗_Cj+ x 𝛼_Cjk

st

ku.s

+ 𝜂_j) (10)