• No results found

Usikkerhet i modellen

4 Boligprismodell

4.2 Lineær regresjon

4.3.4 Usikkerhet i modellen

For å undersøke modellens usikkerhet i nøye detalj så splittes datamaterialet tilfeldig inn i to partisjoner hvor 70 % består av data som modellen spesifiseres på, og 30 % som behandles som ukjente observasjoner modellen forsøker å beregne. Fordelen med en slik tilnærming er at det gjør det mulig å anslå hvor godt modellen vil fungere i praksis dersom den tas i bruk på den generelle boligmassen. Observasjonene som modellen beregner kan betraktes som

ukjente observasjoner som modellen aldri har sett tidligere. Fremgangsmåten har likheter med kryssvalidering, men fordelen med denne fremgangsmåten er at det blir enklere å regne ut feilmarginer for de ulike boligtypene.

Modellen har en forklart varians på 90.93 % for datasettet som holdes utenfor, og en gjennomsnittlig feilmargin på 7.80 % for alle boliger. Oppnåelsen av forklart varians er for øvrig på linje med estimatet som ble avledet ved kryssvalidering som var 91.06 %.

Tabellen nedenfor viser antall observasjoner og utregninger av R2 og MAPE for alle boligtyper med nedbrytninger per boligtype.

Tabell 13: Oversikt over usikkerhet i modellen

Kategori R2 MAPE Observasjoner

Alle boligtyper 90.93 % 7.80 % 8499

Leilighet 89.61 % 7.54 % 7638

Enebolig 78.09 % 12.3 % 301

Rekkehus 88.68 % 7.95 % 353

Tomannsbolig 86.84 % 10.6 % 207

Modellen er vesentlig mer presis for leiligheter enn eneboliger med gjennomsnittlige feilmarginer på henholdsvis 7.54 % og 12.3 %. Dette harmoniserer for øvrig godt med erfaringene fra SSB sine modeller, hvor det rapporteres at det er vanskeligere å lage presise estimater for eneboliger enn leiligheter. Dette har trolig sammenheng med at det finnes langt flere observasjoner av boligsalg for leiligheter i datamaterialet, men også at det generelt sett er vanskeligere å prise særegenheter spesielt for dyre eneboliger.

Under så følger en detaljert oversikt over feilmarginen i prosent for alle boliger, gruppert etter intervaller. Visualiseringen viser for eksempel at 43 % av observasjonene som modellen beregnet har en feilmargin mellom 0 - 5 %. Det er også inkludert en kumulativ telling som viser hvor mange boliger som ligger innenfor det gitte intervallet. For eksempel så kan vi se at

94 % av boligene ligger innenfor det kumulative intervallet på 15 - 20 %. Dette innebærer at kun 6 % av boligene har en feilmargin som overstiger 20 % i absolutt verdi. Tallene er også inkludert som en tabell.

Figur 1: Usikkerhet, alle boliger i Oslo

Tabell 14: Usikkerhet, alle boliger i Oslo

Usikkerhet Antall Prosent Kumulativ prosent

0 % - 5 % 3676 43.3 % 43.3 %

5 % - 10 % 2483 29.2 % 72.5 %

10 % - 15 % 1253 14.7 % 87.2 %

15 % - 20 % 570 6.71 % 93.9 %

20 % - 25 % 249 2.93 % 96.8 %

25 % - 30 % 140 1.65 % 98.5 %

30 % + 128 1.51 % 100 %

En visualisering som viser sammenhengen mellom boligens markedsverdi og prisestimatet som forholdstall av markedsverdien i prosent vises under. Her er boligtypene i tillegg gruppert slik at hvert kvadrat representerer en boligtype.

Figur 2: Usikkerhet som forholdstall av markedsverdi

En observasjon som er svært tydelig er at eneboliger med en markedsverdi over 20 millioner kroner i mange tilfeller undervurderes kraftig i modellen, helt ned mot 50 % av den faktiske markedsverdien. Dette sammenfaller med kritikken som har blitt rettet mot SSB sine

beregninger av boligverdi og er følgelig en kjent problemstilling. Det er likevel interessant å observere at denne problematikken ikke forsvinner automatisk selv om man benytter en boligprismodell med tilsynelatende høy forklaringskraft. For rekkehus og tomannsboliger så ser man ikke en tilsvarende trend. Her er variasjonen i feilmarginen spredt jevnt utover de ulike prisintervallene uten noen klar tendens til å overvurdere eller undervurdere. For

markedsverdien passerer 10 millioner kroner. For prisintervallet under dette så er

usikkerheten jevnt fordelt mellom overvurdering og undervurdering. Det er likevel bare 5 % av observasjonene for leiligheter som har en feilmargin som overstiger 20 %, selv om

visualiseringen kan skape et inntrykk av at avvik i denne størrelsesordenen er mer vanlig enn hva de faktisk er.

Under så følger en tilsvarende oversikt og tabell med feilmargin i prosent for leiligheter.

Feilmarginene for leiligheter sammenfaller med og er nesten identisk fordelt slik som de er for alle boliger. Årsaken til dette er at leiligheter står for nesten 90 % av observasjonene (7638 av 8499 observasjoner) og dermed så påvirker de det totale bildet i svært stor grad.

Figur 3: Usikkerhet, leiligheter i Oslo

Tabell 15: Usikkerhet, leiligheter i Oslo

Usikkerhet Antall Prosent Kumulativ prosent

0 % - 5 % 3379 44.2 % 44.2 %

5 % - 10 % 2233 29.2 % 73.5 %

10 % - 15 % 1129 14.8 % 88.3 %

15 % - 20 % 492 6.44 % 94.7 %

20 % - 25 % 204 2.67 % 97.4 %

25 % - 30 % 110 1.44 % 98.8 %

30 % + 91 1.19 % 100 %

Feilmarginene for eneboliger viser seg å være veldig annerledes sammenlignet med leiligheter. Vi vet fra den overordnede oversikten at den gjennomsnittlige feilmarginen for eneboliger er på 12.3 % sammenlignet med 7.54 % for leiligheter. Det fremkommer tydelig i visualiseringen under at en lavere andel av observasjonene, kun 28 % har en feilmargin på det laveste nivået mellom 0 - 5 %. For den kumulative fordelingen til og med 20 % så utgjør dette 81 % av observasjonene, noe som innebærer at 19 % av observasjonene for eneboliger har en feilmargin som overstiger 20 %. Det som likevel er svært utslagsgivende er at hele 8 % av observasjonene har en feilmargin som overstiger 30 %. For leiligheter så var det kun 1.19 % av observasjonene som hadde en feilmargin i denne størrelsesordenen. Boligprismodellen er mindre presis for eneboliger generelt, men det er også større absolutte avvik for denne boligtypen.

Figur 4: Usikkerhet, eneboliger i Oslo

Tabell 16: Usikkerhet, eneboliger i Oslo

Usikkerhet Antall Prosent Kumulativ prosent

0 % - 5 % 85 28.2 % 28.2 %

5 % - 10 % 80 26.6 % 54.8 %

10 % - 15 % 52 17.3 % 72.1 %

15 % - 20 % 27 8.97 % 81.1 %

20 % - 25 % 20 6.64 % 87.7 %

25 % - 30 % 13 4.32 % 92.0 %

30 % + 24 7.97 % 100 %

For tomannsboliger så ligner fordelingen på den vi ser for eneboliger. Dette henger sammen med at den gjennomsnittlige feilmarginen for tomannsboliger er på 10.6 %. Det er 31 % av observasjonene som har en feilmargin mellom 0 - 5 %, og 86 % av observasjonene har en

feilmargin som er lavere eller lik 20 %, noe som innebærer at 14 % av observasjonene har en større feilmargin enn 20 %. For eneboliger så var det tilsvarende tallet 19 %. For

tomannsboliger så er det 4 % av observasjonene som har en feilmargin som er større enn 30

%, sammenlignet med 8 % for eneboligene.

Figur 5: Usikkerhet, tomannsboliger i Oslo

Tabell 17: Usikkerhet, tomannsboliger i Oslo

Usikkerhet Antall Prosent Kumulativ prosent

0 % - 5 % 64 30.9 % 30.9 %

5 % - 10 % 60 29.0 % 59.9 %

10 % - 15 % 31 15.0 % 74.9 %

15 % - 20 % 24 11.6 % 86.5 %

20 % - 25 % 14 6.76 % 93.2 %

25 % - 30 % 5 2.42 % 95.7 %

30 % + 9 4.35 % 100 %

I motsetning til eneboliger og tomannsboliger så er treffsikkerheten for rekkehus vesentlig

bedre. Den gjennomsnittlige feilmarginen er på 7.95 %, noe som er ganske nært feilmarginen for leiligheter som er på 7.54 %. Fordelingen av feilmarginene for observasjonene ligner derfor på fordelingen vi så for leiligheter. For rekkehusene så har 42 % av observasjonene en feilmargin mellom 0 - 5 %, og 92 % av observasjonene har en feilmargin som er lavere eller lik 20 %, noe som innebærer at 8 % av observasjonene har en feilmargin som er større enn 20

%. Sammenlignet med eneboliger og tomannsboliger så kan vi se at det kun er 1 % av observasjonene som har en feilmargin som er større enn 30 % for rekkehusene.

Figur 6: Usikkerhet, rekkehus i Oslo

Tabell 18: Usikkerhet, rekkehus i Oslo

Usikkerhet Antall Prosent Kumulativ prosent

0 % - 5 % 148 41.9 % 41.9 %

4.3.5 Sammenligning av usikkerhet med SSB sin boligprismodell