3 Datagrunnlag og datasammenstilling
3.2 Boligomsetninger fra eiendomsannonser
Datagrunnlaget som dekker boligomsetninger er innhentet fra FINN.no og avgrenser seg til annonserte bruktboliger solgt i Oslo kommune i årene 2018 og 2019. FINN er en velkjent norsk markedsplass på internett og tilbyr blant annet rubrikkannonsering i forbindelse med eiendomssalg. FINN har en svært høy markedsandel i Norge og SSB har beregnet at om lag 73,6 % av alle eiendomsomsetninger annonseres på markedsplassen. Andelen er høyest i Oslo og Bærum hvor opp mot 96,2 % av alle boligsalg annonseres på FINN (SSB, 2020).
Fordelen med å bruke annonsedata fra FINN er at annonseinformasjonen inneholder oppdatert informasjon om boligene ved salgstidspunktet. Eiendomsmeglingsloven stiller strenge krav til eiendomsmeglerne sin opplysningsplikt, og avhendingsloven gir boligkjøper et sterkt vern dersom det foreligger mangelfulle opplysninger i forbindelse med salget. En konsekvens av dette er at annonseinformasjonen og de tilhørende variablene som beskriver boligene er svært presise. I tillegg til presise variabler så inneholder annonseinformasjonen også informasjon og variabler som ikke nødvendig lar seg gjenfinne i matrikkelen. Dette kan være inngående informasjon om boligens beskaffenhet, som for eksempel at boligen har peis, balkong,
balansert ventilasjon og lignende. Videre så inneholder annonseinformasjonen fritekst i form av en annonseoverskrift og en lengre beskrivende tekst. Dette danner et godt utgangspunkt for å avlede variabler som ikke er eksplisitt angitt i annonsen. Eksempler på dette kan være om det medfølger garasjeplass til boligen, om boligen er å betegne som et oppussingsobjekt eller om boligen har havutsikt. Andre eksempler er informasjon om det finnes tilknyttede
utleieenheter, eller at boligen er klausulert som seniorbolig.
Mange av variablene fra eiendomsannonsene som beskriver boligene eksplisitt kan gjenfinnes i matrikkelen, slik som størrelse eller etasje. I praksis så er det likevel knyttet usikkerhet til dekningen i matrikkelen ettersom det er de individuelle kommunene sin jobb å holde
eiendomsinformasjonen i matrikkelen oppdatert. For det følgende så har det vært viktig med tilgang til presis informasjon for å kunne evaluere ulike boligprismodeller. En naturlig innvending er nok at det finnes boligomsetninger utenfor markedsplassen FINN som kan tilføre forklaringskraft, kanskje spesielt for dyre eneboliger som omsettes gjennom lukkede visninger. Denne informasjonen kan innhentes gjennom grunnboken og matrikkelen, i den utstrekning det finnes oppdaterte forklarende variabler der for boligene. En vesentlig svakhet ved å benytte boligomsetninger utenom FINN er likevel at det ikke finnes informasjon om tilhørende fellesgjeld eller fellesformue enkelt tilgjengelig for boliger hvor dette er relevant.
Dette gjør det svært utfordrende å skulle avlede boligenes markedsverdi på
omsetningstidspunktet. Denne informasjonen er nødvendig å innhente fordi fellesgjeld må tillegges salgsprisene som innhentes fra grunnboken for å komme frem til boligens
markedsverdi. Det er derimot ikke nødvendig å innhente informasjon om fellesgjeld og fellesformue for å applisere boligprismodellen på ukjente boliger senere, siden
markedsverdien er den ukjente størrelsen som skal beregnes.
Datasettet fra FINN inneholder 45 variabler og de presenteres i detalj under.
3.2.1 Boligidentifikasjon
Datasettet fra FINN inneholder tolv variabler relatert til boligidentifikasjon.
Tabell 1: Oversikt over variabler som identifiserer boligene
Variabel Beskrivelse
finn_borettslag_andelsnummer Boligens andelsnummer i borettslaget Variablene beskriver hovedsakelig boligens matrikkeladresse, geografiske koordinater
tilhørende matrikkeladressen og eventuell informasjon om tilknyttet borrettslag.
Matrikkeladressen benyttes til å knytte datasettet fra FINN opp mot salgspriser fra
grunnboken og Oslo kommune sin oversikt over utlignet eiendomsskatt. I tillegg til dette så benyttes matrikkeladressen til å innhente informasjon om bydel, delbydel og grunnkrets. De geografiske koordinatene tilhørende matrikkeladressen benyttes i stor utstrekning til å innhente geografiske attributter fra eksterne datakilder.
3.2.2 Transaksjon
Det er tre variabler i datasettet som inneholder relevant informasjon om boligtransaksjonen.
Dette er informasjon om eventuell fellesgjeld eller fellesformue som følger boligen ved salgstidspunktet. I tillegg til dette så er det laget en variabel som avleder datoen for
salgstidspunktet. Datoen avledes ved å ta utgangspunkt i tidspunktet da boligen ble markert som solgt på markedsplassen, eventuelt tidspunktet da annonsen ble fjernet dersom det
foreligger et salg i grunnboken. Den tinglyste datoen som fremkommer i grunnboken er under normale omstendigheter overtagelsestidspunktet for boligen. Dette finner sted som regel tre måneder etter det faktiske boligsalget, men tidspunktet er åpent for nærmere avtale.
Boligprisene kan endre seg mye over tid, og det foreligger i tillegg til dette en
sesongkomponent som gjør at boligprisene naturlig vil variere i løpet av året. Dette gjør at det
er nødvendig å etablere det konkrete salgstidspunktet slik at det ikke introduseres observasjoner med tidsetterslep som feilrepresenterer sammenhengen mellom
boligegenskaper og markedsverdi i boligprismodellen. Det er for øvrig nyttig å ha datoen for salget dersom man ønsker å indeksregulere boligprisene i modellen for å utjevne store endringer i boligprisene over tid.
Datasettet fra FINN inneholder ingen informasjon om prisantydning eller innrapportert salgspris. Informasjon om boligens salgspris innhentes fra grunnboken ved å knytte boligens matrikkeladresse opp mot grunnboken.
Sammen med informasjon om fellesgjeld og fellesformue så er det mulig å avlede boligens markedsverdi. Salgsprisen som fremkommer i grunnboken er ikke nødvendigvis representativ for boligkjøper sin oppfattelse av boligens markedsverdi. Det er svært mange boliger som selges med betydelig fellesgjeld som kjøper påtar seg ved overtagelsen av boligen. Uten at det tas hensyn til boligens fellesgjeld og eventuelle fellesformue så vil kjøpesummen som
fremkommer i grunnboken fremstå som kunstig lav i mange tilfeller. Det er boligens markedsverdi som å legges til grunn, det vil si salgsprisen tillagt fellesgjeld og fratrukket fellesformue.
Tabell 2: Oversikt over variabler som beskriver boligtransaksjonen
Variabel Beskrivelse
finn_transaksjon_fellesgjeld Boligens fellesgjeld finn_transaksjon_fellesformue Boligens fellesformue finn_transaksjon_solgt_dato Estimert dato for boligsalget 3.2.3 Angitte boligegenskaper
Disse ti variablene angir eksplisitt informasjon om boligegenskaper som angis i annonsene.
Dette er typiske variabler som kan gjenfinnes i matrikkelen under forutsetning av at informasjonen der er oppdatert.
Tabell 3: Oversikt over variabler som er angitt i boligannonsene
Variabel Beskrivelse
finn_boligegenskaper_angitt_boligtype Boligtype (leilighet, enebolig o.l.) finn_boligegenskaper_angitt_eieform Eieform (selveier, andel, aksje) finn_boligegenskaper_angitt_byggeaar Byggeår
finn_boligegenskaper_angitt_etasje Etasje finn_boligegenskaper_angitt_antall_rom Antall rom finn_boligegenskaper_angitt_antall_soverom Antall soverom finn_boligegenskaper_angitt_primaerrom Primærrom i kvm finn_boligegenskaper_angitt_bruksareal Bruksareal i kvm finn_boligegenskaper_angitt_tomteareal Tomteareal i kvm finn_boligegenskaper_angitt_eietomt Eietomt eller festetomt
3.2.4 Avledede boligegenskaper
Dette er nitten variabler som er spesiallaget for masteroppgaven gjennom å avlede
informasjon fra annonseoverskrift, annonsetekst og egenskaper ved boligen som er angitt i annonsen. Det finnes eksempelvis ingen faste sjekkpunkter i eiendomsannonsene som angir om en bolig kan karakteriseres som et oppussingsobjekt. I praksis så har det opparbeidet seg visse kutymer for hvordan man beskriver at en bolig er et oppussingsobjekt. Ved å avlede de vanligste skriveformene, som "oppussingsobjekt", "renovasjonsobjekt", eller "oppussing nødvendig" så er det mulig å identifisere hvilke annonser dette gjelder. Samtidig så må det tas høyde for boliger hvor det beskrives at boligen er "nyoppusset", eller "nylig oppusset" og lignende slik at variablene ikke blir misvisende. Et sammenlignbart eksempel er beskrivelser av medfølgende garasjeplass. Dette er gjerne eksplisitt nevnt, men det finnes mange
eiendomsannonser hvor mulighet for kjøp av garasjeplass eller mulighet for garasjeleie markedsføres som "garasjeplass" i annonseoverskriften med en stjerne bak, og en
medfølgende beskrivelse lenger ned i annonseteksten som spesifiserer hva som legges i ordets betydning.
Tabell 4: Oversikt over variabler som er avledet fra boligannonsene
Variabel Beskrivelse
finn_boligegenskaper_avledet_heis Heis i bygget finn_boligegenskaper_avledet_oppussingsobjekt Oppussingsobjekt
finn_boligegenskaper_avledet_utleiedel Utleiedel eller hybel finn_boligegenskaper_avledet_energikarakter Energikarakter finn_boligegenskaper_avledet_oppvarmingskarakter Oppvarmingskarakter finn_boligegenskaper_avledet_peis Peis
finn_boligegenskaper_avledet_ventilasjon Balansert ventilasjon finn_boligegenskaper_avledet_barnevennlig Barnevennlig område
finn_boligegenskaper_avledet_ingen_gjenboere Ingen gjenboere (ingen innsyn) finn_boligegenskaper_avledet_lademulighet Lademulighet for el-bil
Formålet med å lage disse variablene har vært å undersøke om de kan tilføre forklaringskraft i modellen, samtidig som det må anses som et bidrag til å adressere noen av innsigelsene som har fremkommet mot dagens boligprismodell. Et viktig poeng å få frem er at disse variablene ikke finnes enkelt tilgjengelige. Det er en svært omfattende jobb å avlede de fra det
underliggende datamaterialet, og definisjonen av variablene beror i stor grad på
skjønnsmessige avgjørelser. Det er vanskelig å se for seg muligheter for å avlede tilsvarende variabler for den totale boligmassen, og det vil derfor i praksis være et begrenset
mulighetsrom for å ta i bruk svært detaljerte variabler.