4 Boligprismodell
4.2 Lineær regresjon
4.3.4 Usikkerhet i modellen
For å undersøke modellens usikkerhet i nøye detalj så splittes datamaterialet tilfeldig inn i to partisjoner hvor 70 % består av data som modellen spesifiseres på, og 30 % som behandles som ukjente observasjoner modellen forsøker å beregne. Fordelen med en slik tilnærming er at det gjør det mulig å anslå hvor godt modellen vil fungere i praksis dersom den tas i bruk på den generelle boligmassen. Observasjonene som modellen beregner kan betraktes som
ukjente observasjoner som modellen aldri har sett tidligere. Fremgangsmåten har likheter med kryssvalidering, men fordelen med denne fremgangsmåten er at det blir enklere å regne ut feilmarginer for de ulike boligtypene.
Modellen har en forklart varians på 90.93 % for datasettet som holdes utenfor, og en gjennomsnittlig feilmargin på 7.80 % for alle boliger. Oppnåelsen av forklart varians er for øvrig på linje med estimatet som ble avledet ved kryssvalidering som var 91.06 %.
Tabellen nedenfor viser antall observasjoner og utregninger av R2 og MAPE for alle boligtyper med nedbrytninger per boligtype.
Tabell 13: Oversikt over usikkerhet i modellen
Kategori R2 MAPE Observasjoner
Alle boligtyper 90.93 % 7.80 % 8499
Leilighet 89.61 % 7.54 % 7638
Enebolig 78.09 % 12.3 % 301
Rekkehus 88.68 % 7.95 % 353
Tomannsbolig 86.84 % 10.6 % 207
Modellen er vesentlig mer presis for leiligheter enn eneboliger med gjennomsnittlige feilmarginer på henholdsvis 7.54 % og 12.3 %. Dette harmoniserer for øvrig godt med erfaringene fra SSB sine modeller, hvor det rapporteres at det er vanskeligere å lage presise estimater for eneboliger enn leiligheter. Dette har trolig sammenheng med at det finnes langt flere observasjoner av boligsalg for leiligheter i datamaterialet, men også at det generelt sett er vanskeligere å prise særegenheter spesielt for dyre eneboliger.
Under så følger en detaljert oversikt over feilmarginen i prosent for alle boliger, gruppert etter intervaller. Visualiseringen viser for eksempel at 43 % av observasjonene som modellen beregnet har en feilmargin mellom 0 - 5 %. Det er også inkludert en kumulativ telling som viser hvor mange boliger som ligger innenfor det gitte intervallet. For eksempel så kan vi se at
94 % av boligene ligger innenfor det kumulative intervallet på 15 - 20 %. Dette innebærer at kun 6 % av boligene har en feilmargin som overstiger 20 % i absolutt verdi. Tallene er også inkludert som en tabell.
Figur 1: Usikkerhet, alle boliger i Oslo
Tabell 14: Usikkerhet, alle boliger i Oslo
Usikkerhet Antall Prosent Kumulativ prosent
0 % - 5 % 3676 43.3 % 43.3 %
5 % - 10 % 2483 29.2 % 72.5 %
10 % - 15 % 1253 14.7 % 87.2 %
15 % - 20 % 570 6.71 % 93.9 %
20 % - 25 % 249 2.93 % 96.8 %
25 % - 30 % 140 1.65 % 98.5 %
30 % + 128 1.51 % 100 %
En visualisering som viser sammenhengen mellom boligens markedsverdi og prisestimatet som forholdstall av markedsverdien i prosent vises under. Her er boligtypene i tillegg gruppert slik at hvert kvadrat representerer en boligtype.
Figur 2: Usikkerhet som forholdstall av markedsverdi
En observasjon som er svært tydelig er at eneboliger med en markedsverdi over 20 millioner kroner i mange tilfeller undervurderes kraftig i modellen, helt ned mot 50 % av den faktiske markedsverdien. Dette sammenfaller med kritikken som har blitt rettet mot SSB sine
beregninger av boligverdi og er følgelig en kjent problemstilling. Det er likevel interessant å observere at denne problematikken ikke forsvinner automatisk selv om man benytter en boligprismodell med tilsynelatende høy forklaringskraft. For rekkehus og tomannsboliger så ser man ikke en tilsvarende trend. Her er variasjonen i feilmarginen spredt jevnt utover de ulike prisintervallene uten noen klar tendens til å overvurdere eller undervurdere. For
markedsverdien passerer 10 millioner kroner. For prisintervallet under dette så er
usikkerheten jevnt fordelt mellom overvurdering og undervurdering. Det er likevel bare 5 % av observasjonene for leiligheter som har en feilmargin som overstiger 20 %, selv om
visualiseringen kan skape et inntrykk av at avvik i denne størrelsesordenen er mer vanlig enn hva de faktisk er.
Under så følger en tilsvarende oversikt og tabell med feilmargin i prosent for leiligheter.
Feilmarginene for leiligheter sammenfaller med og er nesten identisk fordelt slik som de er for alle boliger. Årsaken til dette er at leiligheter står for nesten 90 % av observasjonene (7638 av 8499 observasjoner) og dermed så påvirker de det totale bildet i svært stor grad.
Figur 3: Usikkerhet, leiligheter i Oslo
Tabell 15: Usikkerhet, leiligheter i Oslo
Usikkerhet Antall Prosent Kumulativ prosent
0 % - 5 % 3379 44.2 % 44.2 %
5 % - 10 % 2233 29.2 % 73.5 %
10 % - 15 % 1129 14.8 % 88.3 %
15 % - 20 % 492 6.44 % 94.7 %
20 % - 25 % 204 2.67 % 97.4 %
25 % - 30 % 110 1.44 % 98.8 %
30 % + 91 1.19 % 100 %
Feilmarginene for eneboliger viser seg å være veldig annerledes sammenlignet med leiligheter. Vi vet fra den overordnede oversikten at den gjennomsnittlige feilmarginen for eneboliger er på 12.3 % sammenlignet med 7.54 % for leiligheter. Det fremkommer tydelig i visualiseringen under at en lavere andel av observasjonene, kun 28 % har en feilmargin på det laveste nivået mellom 0 - 5 %. For den kumulative fordelingen til og med 20 % så utgjør dette 81 % av observasjonene, noe som innebærer at 19 % av observasjonene for eneboliger har en feilmargin som overstiger 20 %. Det som likevel er svært utslagsgivende er at hele 8 % av observasjonene har en feilmargin som overstiger 30 %. For leiligheter så var det kun 1.19 % av observasjonene som hadde en feilmargin i denne størrelsesordenen. Boligprismodellen er mindre presis for eneboliger generelt, men det er også større absolutte avvik for denne boligtypen.
Figur 4: Usikkerhet, eneboliger i Oslo
Tabell 16: Usikkerhet, eneboliger i Oslo
Usikkerhet Antall Prosent Kumulativ prosent
0 % - 5 % 85 28.2 % 28.2 %
5 % - 10 % 80 26.6 % 54.8 %
10 % - 15 % 52 17.3 % 72.1 %
15 % - 20 % 27 8.97 % 81.1 %
20 % - 25 % 20 6.64 % 87.7 %
25 % - 30 % 13 4.32 % 92.0 %
30 % + 24 7.97 % 100 %
For tomannsboliger så ligner fordelingen på den vi ser for eneboliger. Dette henger sammen med at den gjennomsnittlige feilmarginen for tomannsboliger er på 10.6 %. Det er 31 % av observasjonene som har en feilmargin mellom 0 - 5 %, og 86 % av observasjonene har en
feilmargin som er lavere eller lik 20 %, noe som innebærer at 14 % av observasjonene har en større feilmargin enn 20 %. For eneboliger så var det tilsvarende tallet 19 %. For
tomannsboliger så er det 4 % av observasjonene som har en feilmargin som er større enn 30
%, sammenlignet med 8 % for eneboligene.
Figur 5: Usikkerhet, tomannsboliger i Oslo
Tabell 17: Usikkerhet, tomannsboliger i Oslo
Usikkerhet Antall Prosent Kumulativ prosent
0 % - 5 % 64 30.9 % 30.9 %
5 % - 10 % 60 29.0 % 59.9 %
10 % - 15 % 31 15.0 % 74.9 %
15 % - 20 % 24 11.6 % 86.5 %
20 % - 25 % 14 6.76 % 93.2 %
25 % - 30 % 5 2.42 % 95.7 %
30 % + 9 4.35 % 100 %
I motsetning til eneboliger og tomannsboliger så er treffsikkerheten for rekkehus vesentlig
bedre. Den gjennomsnittlige feilmarginen er på 7.95 %, noe som er ganske nært feilmarginen for leiligheter som er på 7.54 %. Fordelingen av feilmarginene for observasjonene ligner derfor på fordelingen vi så for leiligheter. For rekkehusene så har 42 % av observasjonene en feilmargin mellom 0 - 5 %, og 92 % av observasjonene har en feilmargin som er lavere eller lik 20 %, noe som innebærer at 8 % av observasjonene har en feilmargin som er større enn 20
%. Sammenlignet med eneboliger og tomannsboliger så kan vi se at det kun er 1 % av observasjonene som har en feilmargin som er større enn 30 % for rekkehusene.
Figur 6: Usikkerhet, rekkehus i Oslo
Tabell 18: Usikkerhet, rekkehus i Oslo
Usikkerhet Antall Prosent Kumulativ prosent
0 % - 5 % 148 41.9 % 41.9 %
4.3.5 Sammenligning av usikkerhet med SSB sin boligprismodell