Prisforholdet mellom å leie leilighet og å kjøpe leilighet i Oslo
Prisforholdet mellom å leie leilighet og å kjøpe leilighet i Oslo
XXX XXXXX XXXXXX XXXX XXXX XXXXXXX XXXXXX
VEILEDER
Xxxxx Xxxxxxx
Universitetet i Agder, 2018 Handelshøyskolen ved UiA Institutt for økonomi
Forord
Denne masteroppgaven avslutter vår mastergrad i Økonomi og Administrasjon, med spesialiseringen Økonomisk styring, ved Handelshøyskolen ved Universitetet i Agder i Kristiansand. Avhandlingen er en obligatorisk del av siste semester i vår femårige utdannelse, og utgjør 30 studiepoeng. Ved godkjent oppgave tilkjennes vi tittelen «Siviløkonom».
Hensikten med avhandlingen er at studentene skal ha muligheten til å utføre fordypende arbeid innen ett eller flere av emnene gjennomgått i studieforløpet, og få innsikt i selvstendig vitenskapelig arbeid.
Vår avhandling er en fordypning i temaet eiendomsøkonomi. Temaet har vært et valgfag innenfor vår spesialisering. Dette er en av grunnene til at vi landet på en oppgave som omhandler eiendomsmarkedet, samt en generell interesse for feltet. Vi har tatt for oss boligmarkedet i Oslo, og gjennomført en analyse av forholdet mellom leieprisen i leiemarkedet og omsetningsprisen i eiermarkedet for leiligheter. Valget falt på Oslo, da det finnes et flertall av leiligheter på leiemarkedet, og fordi en analyse av boligmarkedet i hovedstaden trolig er interessant for flere ulike parter.
Vi ønsker å takke de som har bidratt i utarbeidelsen av denne avhandlingen. Spesielt vil vi rette en stor takk til vår veileder Professor Xxxxx Xxxxxxx for svært god veiledning, ved å være tilgjengelig og gi tett oppfølging. I tillegg vil vi takke hverandre for et fint samarbeid i forbindelse med en slik omfattende og utfordrende oppgave i denne avsluttende perioden av vår utdannelse.
Kristiansand, 1. Juni 2018 Xxx Xxxxx Xxxx
Xxxx Xxxxxxx Xxxxxx
Sammendrag
Hensikten med denne oppgaven er å undersøke forholdet mellom leiepris og omsetningspris for leiligheter i Oslo. Internasjonalt har det blitt gjennomført flere studier av slike forholdstall i andre land og byer, men få er gjennomført med data fra det norske boligmarkedet. Vi behandler data fra to separate markeder, herunder markedet for solgte boliger og markedet for utleieboliger. Disse refererer vi til som henholdsvis eiermarkedet og leiemarkedet.
DiPasquale og Wheaton sin 4-kvadrant-modell er det mest sentrale teoretiske grunnlaget for oppgaven. Modellen er en langsiktig likevektsmodell som kobler markedet for bruk av boligareal med eiermarkedet for eiendom, som gjør den relevant for oppgaven. Vi tar utgangspunkt i den hedonistiske pristeorien ved estimering av prisfunksjoner. I tillegg inkluderer vi Alonso-Muth-Mills-modellen om lokalisering, og Xxxxx Xxxxxxxx teori “Marked for Lemons”. Disse komplimenterer drøftingen av funnene i analysen.
I analysen benytter vi 2538 observasjoner for eiermarkedet fra Eiendomsverdi, og 306 observasjoner for leiemarkedet fra Xxxx.xx, i tidsperioden januar og februar 2018.
Informasjonen som var vesentlig å samle inn var omsetningspris, fellesgjeld, primærromstørrelse og beliggenhet for de solgte boligene, og månedsleie, primærromstørrelse og beliggenhet for utleieboligene. Bydelene i Oslo brukes som beliggenhetsindikator. Vi definerer en ny avhengig variabel for eiermarkedet som vi kaller totalpris. Denne består av omsetningsprisen og en andel av fellesgjelden knyttet til boligen. Vi benytter to metoder ved beregning av forholdstall. Den første metoden baserer seg på estimert leiepris og estimert totalpris. Vi benytter her semilogaritmisk funksjonsform, ettersom denne passet best for våre data. Den andre metoden baserer seg på faktiske priser i markedet. Med utgangspunkt i observasjonene i leiemarkedet forsøkte vi å finne en likest mulig solgt bolig, basert på beliggenhet og størrelse. Bruk av to ulike metoder gir et bedre grunnlag for tolkning av boligmarkedet i Oslo.
Våre resultater viser at det ikke foreligger et helt fast forhold mellom leiepris og totalpris i Oslo i tidsperioden. Vi finner derimot at forholdet mellom leiepris og totalpris varierer med beliggenhet. Videre finner vi en svak tendens til at forholdet varierer med primærromstørrelse.
Innholdsfortegnelse
Forord I
Sammendrag II
Figuroversikt VI
Tabelloversikt VIII
1. Innledning 1
1.2 Oppbygging av oppgaven 2
2. Bakgrunn 4
2.1 Boligmarkedet i Norge 4
2.1.1 Eiermarkedet i Norge 5
2.1.2 Leiemarkedet i Norge 6
2.2 Boligmarkedet i Oslo 7
2.2.1 Eiermarkedet i Oslo 7
2.2.2 Leiemarkedet i Oslo 9
2.3 Tidligere studier 11
3. Teori 14
3.1 Prisdannelsen i eiermarkedet og leiemarkedet 14
3.1.1 Prisdannelsen i eiermarkedet 14
3.1.2 Bokostnader 16
3.1.3 Prisdannelsen i leiemarkedet 17
3.2 DiPasquale-Wheaton-modellen 18
3.3 Xxxxxx-Xxxx-Mills-modellen 26
3.4 Hedonistisk prisfunksjon 29
3.5 Marked for “lemons” 31
3.6 Hypoteser 33
3.6.1 Hypoteser knyttet til eiermarkedet 34
3.6.2 Hypoteser knyttet til leiemarkedet 35
3.6.3 Hypoteser knyttet til forholdstallene 36
4. Økonometrisk modell 38
4.1 Transaksjonsmodellen og Leieprismodellen 39
4.2 Utdypelse om regresjonsfunksjonene 39
4.2.1 Lineær multivariat regresjon 40
4.2.2 Multivariat logaritmisk regresjon 41
4.2.3 Forenklet grafisk fremstilling av regresjonsmodeller 41
4.2.4 Forutsetninger for regresjonsanalyse 43
4.3 Hypotesetesting 44
5. Datainnsamling og beskrivelse av datamaterialet 46
5.1 Innsamlingsmetode og datarensing 46
5.1.1 Eierboliger 47
5.1.2 Leieboliger 49
5.2 Definisjon og operasjonalisering av variabler 51
5.2.1 Avhengige variabler 51
5.2.2 Uavhengige variabler 51
5.2.3 Variabeloversikt 54
5.4 Koding av datamateriale 55
5.3 Presentasjon av datamateriale 57
5.3.1 Deskriptiv statistikk for eiermarkedet 57
5.3.2 Deskriptiv statistikk for leiemarkedet 62
5.3.3 Korrelasjon 66
6. Estimering av regresjonsfunksjoner og testing av hypoteser 71
6.1 Lineær, semilogaritmisk og dobbeltlogaritmisk regresjonsfunksjon for eiermarkedet 72
6.2 Lineær, semilogaritmisk og dobbeltlogaritmisk regresjonsfunksjon for leiemarkedet 76
6.3 Estimering av endelig regresjonsfunksjon 80
6.3.1 Undersøkelse av 𝛾-verdi 80
6.3.2 Re-estimering av regresjonsfunksjon 81
6.4 Hypotesetesting 85
6.4.1 Hypotesetester for hypoteser knyttet til eiermarkedet 85
6.4.2 Hypotesetester for hypoteser knyttet til leiemarkedet 87
7. Beregning av forholdstall 90
7.1 Benyttede metoder 90
7.1.1 Metode I 90
7.1.2 Metode II 91
7.2 Presentasjon av forholdstall - Metode I 92
7.3 Presentasjon av forholdstall - Metode II 95
7.4 Grunnlag for tolkning av forholdstallene 101
8. Videre drøfting av forholdstall 102
9. Konklusjoner 109
10. Litteraturhenvisninger 111
11. Vedlegg 117
Vedlegg 1 – Refleksjonsnotat av Xxx Xxxxx Xxxx 117
Vedlegg 2 – Refleksjonsnotat av Xxxx Xxxxxxx Xxxxxx 119
Vedlegg 3 – Kommandoer (do-fil) i STATA for eiermarkedet 122
Vedlegg 4 – Kommandoer (do-fil) i STATA for leiemarkedet 125
Figuroversikt
Figur 2.1: Utvikling i omsetningsprisen, omsetning av boligeiendommer med bygning i fritt salg 5
Figur 2.2: Xxxxxx solgte boliger per måned i Norge 6
Figur 2.3: Boligprisutvikling i Norge og de største byene 8
Figur 2.4: Boligprisutvikling for leiligheter i Oslo og i hver bydel 9
Figur 2.5: Gjennomsnittlig månedsleie for 2-roms leiligheter på 60 m2 i større byer 10
Figur 3.1: Tilbuds- og etterspørselskurve i boligmarkedet 15
Figur 3.2: Grafisk fremstilling av 4-kvadrant-modellen 19
Figur 3.3: Virkningen av et skift i etterspørselskurven i den nordøstlige kvadranten
ved en økning av etterspørselen 23
Figur 3.4: Virkningen av en rotasjon av kurven i den nordvestlige kvadranten ved en reduksjon av i 24
Figur 3.5: Virkningen av et skift i tilbudskurven i den sørvestlige kvadranten ved en økning av byggekostnadene 25
Figur 3.6: Kurven for husleie og de ulike komponentene husleien består av 28
Figur 3.7: En forenklet modell av den hedonistiske prisfunksjonen 30
Figur 4.1: Regresjonsmodell med avhengig variabel og en uavhengig variabel 42
Figur 4.2: Regresjonsmodell med avhengig variabel, en uavhengig variabel og en dummyvariabel 43
Figur 5.1: Kart over Oslo inndelt i bydeler 47
Figur 5.2: Histogram for omsetningspris 59
Figur 5.3: Histogram for fellesgjeld 60
Figur 5.4: Histogram for totalpris 60
Figur 5.5: Histogram for primærrom 61
Figur 5.6: Histogram for alder 61
Figur 5.7: Histogram for månedsleie 64
Figur 5.8: Histogram for primærrom 65
Figur 5.9: Histogram for antall soverom 65
Figur 5.10: Histogram for etasje 66
Figur 6.1: Spredning i restledd for eiermarkedet, f.v. lineær, semilog og dobbeltlog 75
Figur. 6.2: Restleddsfordeling for eiermarkedet, f.v. lineær, semilog, dobbeltlog 75
Figur 6.3: Spredning i restledd for leiemarkedet, f.v. lineær, semilog og dobbeltlog 79
Figur 6.4: Restleddsfordeling for leiemarkedet, f.v. lineær, semilog og dobbeltlog 79
Figur 6.5: Spredning i restledd, eiermarkedet til venstre og leiemarkedet til høyre 84
Figur 6.6: Restleddsfordeling, eiermarkedet til venstre og leiemarkedet til høyre 85
Figur 7.1: Linjediagram for estimerte forholdstall, primærromstørrelse på x-aksen 94
Figur 7.2 Linjediagram for estimerte forholdstall, bydeler på x-aksen 95
Figur 7.3: Linjediagram med gjennomsnittsverdier for forholdstall, delt inn i bydeler 99
Figur 8.1: Forholdstall i hver bydel, metode I i grønt og metode II i svart 106
Tabelloversikt
Tabell 5.1: Frafallsoversikt eierdata 48
Tabell 5.2: Frafallsoversikt leiedata 50
Tabell 5.3: Variabeloversikt 54
Tabell 5.4: Variabelnavn og koding av variabler i datasettet for eiermarkedet 56
Tabell 5.5: Koding av variabler i datasettet for leiemarkedet 56
Tabell 5.6: Deskriptiv statistikk for eiermarkedet, N=2538 57
Tabell 5.7: Deskriptiv statistikk for leiemarkedet, N=306 62
Tabell 5.8: Korrelasjonsmatrise for eiermarkedet 67
Tabell 5.9: Korrelasjonsmatrise for leiemarkedet 68
Tabell 6.1 Regresjonsmodeller eiermarkedet, p-verdi i parentes, N=2538 72
Tabell 6.2: Estimerte regresjonsmodeller leiemarkedet, p-verdi i parentes, N=306 76
Tabell 6.3: Test for ulike 𝛾-verdier 80
Tabell 6.4: Re-estimert semilogaritmisk funksjon for eiermarkedet og leiemarkedet,
p-verdi i parentes 81
Tabell 7.1: Forholdstall beregnet for referanseboligen 93
Tabell 7.2 - Del 1: Forholdstall delt inn i bydelene, første halvdel av bydelene 96
Tabell 7.2 - Del 2: Forholdstall delt inn i bydelene, andre halvdel av bydelene 97
Tabell 7.3: Gjennomsnitt, standardavvik og varians 100
Tabell 7.4: Forholdstall inndelt i grupper av primærromstørrelser, N=109 100
1. Innledning
Spørsmålet om hvor man skal bosette seg, og om man skal kjøpe eller leie bolig, er noe som alle vil måtte ta stilling til på ett eller flere tidspunkt i livet. Det er mange faktorer som spiller inn når avgjørelsen skal tas, deriblant pris, beliggenhet, størrelse og standard. Prisutviklingen i boligmarkedet i Oslo har vært et mye omtalt tema det siste tiåret, og vil til alle tider kunne anses å være i vinden. Vi vet at eiendomspriser og dens utvikling spiller en vesentlig rolle i den nasjonale økonomien. I kjølvannet av finanskrisen i 2008 var det til og med en anmodning fra EU, og deres råd for Økonomi og Finans, om at boligprisindeksen skulle fungere som en av de primære indikatorene på om en nasjons økonomi er i balanse sett ut ifra et makroøkonomisk perspektiv (Statistisk Sentralbyrå1, 2017).
Denne avhandlingen er en empirisk analyse av forholdet mellom leiepris og omsetningspris for leiligheter i Oslo. Vi vil se på ulike kjennetegn og attributter ved leilighetene som antas å påvirke leieprisene og omsetningsprisene hver for seg, og ut ifra dette avdekke forholdet mellom prisene i de to delmarkedene. Problemstillingene i oppgaven lyder som følger:
1. Hvilke faktorer bestemmer omsetningsprisen? Hvilke faktorer bestemmer leieprisen?
2. Hvilket forhold er det mellom leiepris for leiebolig og omsetningspris for eierbolig?
Den første problemstillingen må avdekkes før vi kan finne forholdet mellom leiepris og omsetningspris. Dette er dermed ikke hovedproblemstillingen i oppgaven. Oppgaven kommer i hovedsak til å dreie seg om den andre problemstillingen, der forholdstallene skal utarbeides og analyseres.
Temaet er interessant for alle som vurderer å kjøpe eller leie egen bolig, eller de som allerede eier eller leier. Disse vil normalt være over 18 år. Profesjonelle aktører i boligmarkedet, for eksempel eiendomsmeglere og eiendomsutviklere i eiermarkedet, og aktører som Fredensborg og Utleiemegleren i leiemarkedet, vil også kunne finne denne analysen nyttig. Temaet er heller ikke skrevet spesifikt om tidligere, noe som gjør det mer interessant for oss å belyse.
Siden vi begge snart skal inn i boligmarkedet i Oslo, er det spennende for oss å få et dypere innblikk i det som driver leieprisene og omsetningsprisene for leiligheter, og hvilket forhold det er mellom disse.
I oppgaven har vi valgt å begrense analysen til Oslo og til boligtypen leiligheter. Siden vi fokuserer på både utleie og kjøp av bolig var det mest naturlig å velge leiligheter. Dette fordi leiligheter i størst grad blir benyttet som utleieboliger. Vi valgte Oslo fordi vi vet at det finnes et stort antall utleieboliger der. I tillegg ligger hovedstaden generelt på et høyere prisnivå enn resten av landet, og er den byen i Norge med flest innbyggere og størst antall tilflyttere.
Dermed er det grunnlag for å finne tilstrekkelig data for Oslo.
1.2 Oppbygging av oppgaven
I kapittel 2 presenterer vi bakgrunnsinformasjon og statistikk om eiendomsmarkedet i Norge og i Oslo. Vi tar for oss eiermarkedet og leiemarkedet hver for seg. Informasjonen i dette kapitlet vil legge grunnlaget for temaet i oppgaven.
I kapittel 3 presenterer vi relevant teori knyttet til boligmarkedet. Vi tar for oss fem ulike teorier som er interessante for vår oppgave. Særlig er 4-kvadrant-modellen til DiPasquale og Wheaton relevant når det gjelder forholdet mellom leiepris og omsetningspris. I tillegg presenteres hypotesene i oppgaven.
Kapittel 4 tar for seg økonometrisk modell. Her beskriver vi multivariat lineær funksjonsform, semilogaritmisk funksjonsform og dobbeltlogaritmisk funksjonsform. I tillegg presenterer vi Transaksjonsmodellen for eiermarkedet og Leieprismodellen for leiemarkedet. Vi legger også frem teori knyttet til hypotesetesting.
I kapittel 5 forklarer vi hvordan vi har samlet inn data benyttet i analysen og hva som inngår i datasettene. I tillegg følger en oversikt over koding av data og en presentasjon av datamaterialet med gjennomsnitts, maksimums- og minimumsverdier.
I kapittel 6 presenteres regresjonsfunksjonene estimert i programmet STATA for de to ulike datasettene. Til slutt velger vi én av de tre regresjonsfunksjonene som skal brukes videre i analysen. Her gjennomføres også hypotesetesting knyttet til den første problemstillingen.
Kapittel 7 tar for seg utarbeidelsen av forholdstallene. Vi benytter to metoder for å beregne forholdstall. Den første metoden benytter regresjonsfunksjonen for å estimere henholdsvis omsetningspris og leiepris for ulike primærromstørrelser og beliggenheter. Ved bruk av den
andre metoden finner vi par av leiligheter direkte ut fra datasettene for eier- og leiemarkedet, og beregner forholdet mellom faktisk leiepris og faktisk omsetningspris for hvert av parene.
I kapittel 8 drøftes resultatene og hovedproblemstillingen nærmere. De to metodene for beregning av forholdstall settes opp mot hverandre, og vi diskuterer hva forholdstallene kan gi en indikasjon på i boligmarkedet i Oslo.
Avslutningsvis, i kapittel 9, følger konklusjoner basert på våre resultater.
2. Bakgrunn
I denne delen av oppgaven presenterer vi informasjon som skal kaste lys over oppgavens innhold. Vi gir først innsikt i boligmarkedet på nasjonal basis, og spisser det deretter inn mot hovedstaden, da analysen vi foretar oss omhandler boligmarkedet i Oslo.
2.1 Boligmarkedet i Norge
Det er per 6. Juni 2017 registrert 2 515 589 boliger i Norge. Av disse er 598 020 i boligblokker. Veksten fra året før i antall blokkleiligheter var over dobbelt så stor som veksten i antall eneboliger (Statistisk Sentralbyrå, 20181). Dette sier noe om den store etterspørselen etter leiligheter. Det er ifølge Huseiernes Landsforbund (2017) store regionale forskjeller i boligbalansen, det vil si veksten i etterspørselen etter bolig fratrukket antall nye boliger som forventes å bli bygget. I 2017 ble det spådd en økning i behovet for nye boliger på 33 500, mens det ble bygget 31 500 nye boliger. Dette etterlater etterspørselssiden umettet, med et underskudd på 2000 boliger. Den negative balansen på landsbasis forklares i stor grad av det store boligunderskuddet i hovedstaden.
Boligprisene i Norge har hatt en jevn økning i lang tid, men det siste året har det vært en liten nedgang i prisene. Det siste året er det Oslo som har hatt størst nedgang i boligprisene. I tillegg er blokkleiligheter den boligtypen som på landsbasis har sunket mest i pris, med en nedgang på 4,6 % (Statistisk Sentralbyrå, 20182). Totalt sett ser vi derimot en relativt jevn økning av boligprisene det siste tiåret. Under følger en illustrasjon av utviklingen i kjøpesum per omsetning i Norge fra 2008 til første kvartal 2018 (Statistisk Sentralbyrå, 20183):
Figur 2.1: Utvikling i omsetningsprisen, omsetning av boligeiendommer med bygning i fritt salg
2.1.1 Eiermarkedet i Norge
Av alle husholdninger var det i 2016 på landsbasis 77,2% som eide egen bolig. De som eier har enten bolig i borettslag og er andelseier, eller har en selveierbolig. Omtrent 14,1% av husholdninger er andelseiere og 63,1% er selveiere (Statistisk Sentralbyrå, 20171). Xxxxxxxxx og Xxxxxxx (2009) forklarer godt hvordan borettslag karakteriseres i Norge. Formelt sett er andelseierne i realiteten leietakere, da det er borettslaget som står som eier av selve eiendommen. Andelseierne innehar kun en bruksrett på boligen. Prisen for boliger i borettslag består av to komponenter. Den inneholder både et innskudd, som representerer prisen for den andel av borettslaget boligen representerer, og en andel av fellesgjelden til borettslaget som er tilknyttet boligen. Innskuddet er en egenandel som kjøperen må skaffe midler til på egenhånd. Fellesgjelden betales ned løpende av den som har borett gjennom månedlige avdrag og renter. I Norge er renten på borettslagenes fellesgjeld lavere enn renten på private lån, som gjør at det kan være mer prisgunstig å eie i borettslag enn å ha selveierbolig. Finansieringsmodellen for borettslag kan gjøre det mulig for husholdninger som ellers ville vært leietakere å eie boligen sin, da egenkapital og lån som kreves for kjøpet kun tilsvarer innskuddet, og ikke fellesgjelden. Ved selveie eier man fullt og helt sin egen bolig og står selvstendig i eventuelle gjeldsforhold til banken. Selveierboliger kan også ha noe fellesgjeld, i hovedsak dersom sameiet har tatt opp lån (Rammen, 2017). I den nye boliglånsforskriften, som trådte i kraft 1. januar 2017, ble det innført en ny bestemmelse om at det samlede lån og gjeld konsumentene har ikke kan overstige fem ganger brutto inntekt. Det er også et krav om egenkapital på 15%, som ble videreført fra tidligere i den nye forskriften (Xxxxxxxxxxx.xx, 20161).
I 4. kvartal 2017 ble det omsatt i alt 24 733 boligeiendommer med bygning omsatt i fritt salg i Norge (Statistisk Sentralbyrå, 20184). I enkelte perioder i løpet av et år selges det betydelig færre boliger. Figur 2.2 nedenfor, utarbeidet av Eiendom Norge (20181), viser antall solgte boliger per måned på landsbasis. En ser at det selges færre boliger i juli og desember, og at det omsettes flest boliger i mai, juni og september.
Figur 2.2: Xxxxxx solgte boliger per måned i Norge
2.1.2 Leiemarkedet i Norge
Ifølge Xxxxxx, Xxxxxxx og Xxxx (2017) og nettmagasinet E24 (2017) utgjorde sekundærboliger 15 % av landets boligmasse i 2016. Sekundærbolig kan defineres som annen bolig enn den en konsument oppgir som sin folkeregistrerte adresse (Xxxxxxxxxxx.xx, 20162). En betydelig del av sekundærboliger brukes til utleie, men de brukes også til pendlerbolig, investeringsobjekt, fritidsbolig i byen og lignende, som beskrives i Sekundærboligundersøkelsen, gjennomført av Norges Eiendomsmeglerforbund og Ambita (2017). I 2016 var det en andel på 22,7 % av husholdninger i Norge som leide boligen sin (Statistisk Sentralbyrå, 20172). De fleste av leietakerne holder til i de største byene, og leieprisene er betraktelig høyere i byene enn på mindre tettsteder. I motsetning til eiermarkedet, er leiemarkedet preget av korte leieforhold. På landsbasis er det flest privatpersoner som er utleiere, men profesjonelle aktører utgjør også en betydelig andel (Statistisk Sentralbyrå, 20173).
Som leietaker har en rett til å bo i en annens bolig på bestemt eller ubestemt tid, såfremt man overholder betingelsene fastsatt mellom leietaker og utleier, og såfremt man ønsker å bo i boligen. Ved inngåelse av et nytt leieforhold er det vanlig at utleier legger frem en formell kontrakt som leietaker må samtykke til og underskrive. Her defineres gjerne beløpet for husleien leietaker skal betale inn, og størrelsen på depositumet leietaker må betale som sikkerhet til utleier ved kontraktinngåelsen. Det vanligste er å benytte en månedlig leiesum, men enkelte aktører opererer blant annet med ukesleie. Størrelsen på depositumet er i mange tilfeller satt lik tre måneders husleie, men i flere tilfeller settes depositumet til en eller to måneders husleie, eller et “passende” rundt tall. Leietaker har krav på at utleier oppretter en depositumskonto i banken i deres navn, slik at leietaker får renter på innskuddet (Leieboerforeningen, 2018). Det er store variasjoner i hva utleiere inkluderer i månedsleien. Både møbler, hvitevarer, TV-abonnement, internett, strøm, varmtvann og oppvarming er goder som kan inkluderes av utleier. Hvorvidt noen av disse er inkludert i leien eller ikke kan ha påvirkning på leieprisene. Det er for eksempel naturlig at månedsleien vil være høyere dersom alle godene er inkludert, sammenlignet med en månedsleie der ingen er inkludert (Huseiernes Landsforbund, 2018).
2.2 Boligmarkedet i Oslo
Som Norges hovedstad er Oslo den byen med høyest folkemengde og befolkningstetthet, med 673 469 innbyggere per 1. januar 2018 (Statistisk Sentralbyrå, 20185). Befolkningen har også økt hvert år i lang tid (Oslo Kommune, 20181). Dermed er behovet for boliger i byen stort.
Da Oslo er en storby, er store deler av boligene plassert i leilighetskomplekser, som vil skille seg fra bygningssammensetningen på mer rurale steder. Hovedstaden har den største andel av husholdninger i boligblokker i landet, med 228 052 husholdninger per 2016. Til sammenligning bor 65 781 husholdninger enten i enebolig, tomannsbolig eller rekkehus, kjedehus og andre småhus (Statistisk Sentralbyrå, 20172). Oslo består av 15 bydeler i tillegg til sentrum og marka (Oslo kommune, 20182), og bygningstype og boligpriser har vist seg å variere i de ulike bydelene (ByplanOslo, 2018).
2.2.1 Eiermarkedet i Oslo
Eiermarkedet i Oslo er preget av høye priser og raske salg, som i stor grad er resultatet av knapphet på boliger (Mikalsen, 2016). I 2016 hadde 36,6 % av husholdninger selveierbolig, og 33,3 % var andelseiere eller aksjeeiere i Oslo (Statistisk Sentralbyrå, 20172).
Boligprisene i Oslo har i lang tid vært betydelig høyere enn i resten av landet. Figuren under, utarbeidet av Xxxxxxxxx (2018), viser utviklingen i boligprisene i hele Norge og de største byene. I løpet av 2017 så vi en prisnedgang i store deler av landet, som vi ser ga mest utslag i Oslo.
Figur 2.3: Boligprisutvikling i Norge og de største byene
For leiligheter har bydel Frogner i lang tid hatt de høyeste prisene, mens Stovner og Xxxxxx Xxxxxxxxxx har hatt de laveste prisene. Prisutviklingen i bydelene har for leiligheter i tillegg vært svært parallell og forholdet mellom dem har forblitt relativt likt. Prisutviklingen for leiligheter i alle bydelene i Oslo illustreres i figuren under, utarbeidet av Xxxxxxxxx (2018).
Figur 2.4: Boligprisutvikling for leiligheter i Oslo og i hver bydel
I 4. kvartal 2017 ble det omsatt 2 052 boligeiendommer med bygning omsatt i fritt salg i Oslo (Statistisk Sentralbyrå, 20183). Boliger på det overopphetede markedet i Oslo selges svært fort. Grunnen til dette er underskudd av boliger, som også presser prisene opp, ifølge Xxxxxxxx (2016). Basert på Eiendom Norge sine tall for omsetningstid ble boliger i Oslo i gjennomsnitt solgt i løpet av 23,5 dager i 2017, med tall helt ned i 13 dager for februar og mars. På landsbasis var gjennomsnittlig omsetningstid i samme periode hele 40,42 dager.
2.2.2 Leiemarkedet i Oslo
Sekundærboliger utgjorde 15,67 % av hovedstadens boligmasse i februar 2017, ifølge Xxxx (2017). Andelen varierer i de ulike bydelene, og Frogner bydel hadde som eksempel hele 35
% sekundærboliger i 2016 (E24, 2017). Grunnet høy boligprisvekst i Oslo, har boliglånsforskriften fra 2017 et krav om 40% egenkapital ved lån til sekundærbolig i Oslo, sammenliknet med 15 % i resten av landet. I tillegg gis mindre fleksibilitet til bankene i forbindelse med boliglån i forhold til andre steder i landet (Xxxxxxxxxxx.xx, 20161). Det er flest leiligheter som blir sekundærboliger i Oslo, som også indikerer at en stor del utleieboliger på markedet er leiligheter (Statistisk Sentralbyrå, 20173).
Leiemarkedet er stort i hovedstaden. I 2016 var 30,1% av alle husholdninger leietakere, og omkring en av fire innbyggere i Oslo bodde i leid bolig (Statistisk Sentralbyrå, 20161,2).
Andelen leietakere i Oslo er dermed betydelig høyere enn andelen leietakere på 22,7% for
hele landet, og høyest av alle byene (Statistisk Sentralbyrå, 20172). I kontrast til resten av landet, leies boliger i Oslo, ifølge Statistisk Sentralbyrå (2017), i størst grad ut av profesjonelle utleieaktører, eksempelvis Utleiemegleren, Fredensborg og Forenom. Likevel ser en via xxxx.xx at det en betydelig andel private tilbydere. I tillegg til andelen leietakere, er også leieprisene i Oslo høyere enn i resten av landet. Under følger en illustrasjon over månedsleie for 2-roms leiligheter på 60 kvadratmeter i større byer, der Oslo er sortert i bydelsgrupper (Statistisk Sentralbyrå, 20173). Det fremkommer av denne at alle bydeler i Oslo har høyere leiepriser enn i resten av landet.
Figur 2.5: Gjennomsnittlig månedsleie for 2-roms leiligheter på 60 m2 i større byer
Informasjonen i dette kapitlet har lagt grunnlaget for å foreta en analyse av boligmarkedet i Oslo, og kan gi oss noen indikasjoner på hva slags funn vi kan komme til å gjøre senere i oppgaven.
2.3 Tidligere studier
Xxxxxx og Xxxxxx (2014) har studert utviklingen i eiermarkedet og leiemarkedet for leiligheter i Oslo. De har valgt å se på lønnsomheten av å eie og å leie, og har benyttet data fra tidsintervallet 1997-2013. I deres analyse vurderes det å eie bolig opp mot å leie bolig gjennom oppstillinger av kontantstrømmer. Faktorene geografisk beliggenhet og antall rom blir brukt for å differensiere mellom boligene. Hovedfunnene i analysen var at det er mer lønnsomt å kjøpe leilighet i tidsperioden, med unntak av tidsperioden 2002-2007. Dersom det skulle være mer lønnsomt å leie i tidsperioden 2002-2007, måtte personen reinvestere de sparte utgiftene. Videre fant de, gjennom estimerte nåverdiberegninger, at den nominelle verdiøkningen ved å eie sammenlignet med å leie ville være en ubetydelig faktor for årene 2013 til 2018. Den årlige verdiøkningen måtte være mellom 3,1 % og 3,8 % for at man skulle være indifferent mellom å eie eller leie.
En analyse gjort av Bracke (2015) i London sentrum undersøker leie- og eierboliger. Undersøkelsen er gjort i tidsperioden 2005-2011. Han har dokumentert eksistensen av systematiske forskjeller i omsetningspris-til-leiepris-raten på tvers av boligtype og innenfor samme urbane område. I oppgaven finner forfatteren at raten mellom omsetningspris og leiepris endrer seg på tvers av boligtyper. Han finner at større boliger og boliger plassert i mer attraktive områder har høyere omsetningspris-til-leiepris-rate. Denne forskjellen forklares gjennom en sikringsmodell som viser at husholdninger foretrekker å kjøpe boliger der de oppfatter at risikoen knyttet til å leie er større enn å eie. Bracke finner også at markedet er tynnere for eiendommer som er større, og eiendommer som er lokalisert i dyrere strøk. Som følge av dette finner Bracke at det er større variasjon i leieprisene for disse eiendommene enn for de som er mindre, eller lokalisert i nabolag med lavere prisnivå. Videre finner han at eneboliger har gjennomsnittlig høyere omsetningspris-til-leiepris-rate enn leiligheter, på grunnlag av antall soverom og kvadratmeter. Han finner også at antall soverom har større effekt på leieboliger enn eierboliger.
Xxxxx, Xxxxxxx og Xxxxxx (2008) undersøkte det kvartalsvise forholdet mellom leiepris og omsetningspris for det samlede tilbudet av eiendom, der eieren benytter boligen selv i USA. Analysen deres benytter data med prisindekser for leiepris og omsetningspris fra 1960 til midten av 2000, som er hentet fra undersøkelsene i Decennial Census of Housing (DCH) i USA. Analysen deres ble gjort for 1960-2007. Dermed har de bruk estimerte tall for 2000-
2007. De har brukt en totrinns fremgangsmåte for å estimere leiepris-omsetningspris-rater. Først har de brukt data fra 1960-2000 til å utvikle benchmark-estimater av gjennomsnittlige kalkulatoriske leiepriser til boligeiere, gjennomsnittlige priser på eide boliger og samlet leiepris-omsetningspris-rate for boligareal benyttet av eierne. Trinn nummer to bestod av å bruke kvartalsvise indekser på leie- og omsetningspriser til å interpolere henholdsvis leiepriser og omsetningspriser mellom DCH-benchmarkene, i tillegg til å ekstrapolere for årene etter 2000, som de ikke hadde data for. De har funnet at leiepris-omsetningspris-rate varierte mellom 5 % og 5,5 % i tidsperioden 1960-1995, og at den sank kraftig etter 1995. I slutten av 2006 hadde raten et historisk lavpunkt på 3,5 %. Ifølge forfatterne, ville det trolig kreve et betydelig fall i boligprisene dersom raten skulle ha returnert til den historiske gjennomsnittsverdien i løpet av en periode på omtrent 5 år.
En studie gjort i Houston, Texas, av Hattapoglu og Xxxxx (2014), undersøkte hvordan husholdningers forventninger til verdistigning påvirker boligprisene. I denne studien ble det benyttet to unike datasett med omsetningspriser og leiepriser fra tre tidsperioder; 1996-2006, 2000-2006 og 2003-2006. I studien har de eliminert noe av det som i tidligere studier har vist seg å være problematisk, herunder at studiene ikke har tatt høyde for kvalitetsforskjellen i boligene, koblingen mellom omsetningspris og leiepris på tvers av boligtyper, og fordelingen av tomteareal for bolig. De benytter hedonistisk estimering for å sammenkoble omsetningspriser og leiepriser for tilnærmet like boliger. Forfatterne viser at husholdninger har forventninger om verdiøkning. Disse forventningene er i stor grad basert på økning i kjøpspris, ikke leiepris. Dette kan være en antydning til ustabilitet i kjøpsprisene. Dersom forventningene hadde vært basert på en økning i leiepris fremfor kjøpspris, ville situasjonen ha lignet på de forventninger man har i aksjemarkedet om aksjepris kontra dividender.
Forfatterne skriver at dersom man forventer å få høyere dividender, vil man investere mer i de aksjene. Dette driver aksjeprisen oppover, som indikerer at prisene er påvirket av dividendene og at det er stabilitet i dividend-to-price raten. Dette er overførbart til eiendomsmarkedet på den måten at om man skulle basert boligkjøp på avkastningen på boligen, altså den implisitte leien, ville dette ha sørget for stabilitet i leiepris-til-omsetningspris-raten. Forfatterne finner at husholdninger som bor nærmere forretningsdistriktet forventer at boligen deres vil øke i verdi i større grad enn de som bor lenger vekk fra forretningsdistriktet. Som følge av dette finner de at leiepris-til-omsetningspris-raten avtar jo nærmere man kommer forretningsdistriktet.
Gallin (2008) har undersøkt hvor godt leiepris-til-omsetningspris-raten kan forutsi fremtidige endringer i realleiepris og realomsetningspris. Han har benyttet data fra USA for omsetningspriser og leiepriser i perioden 1970-2005. Xxxxxx finner bevis for at leiepris-til- leiepris-raten kan forutsi endringer i realomsetningspris gjennom perioder på 4 år, men at raten ikke kan forutsi endringer i realleiepris over samme tidsperiode. Hovedfunn i analysen er at når omsetningsprisene er høye relativt til leieprisene, altså at leiepris-til-omsetningspris- raten er relativt lav, så følger vanligvis en periode med større vekst i realleiepris og mindre vekst i realomsetningspris. I analysen finner Xxxxxx, i samsvar med Xxxxxx (2002), at lav leiepris-til-omsetningspris-rate kan være en indikasjon på en overprising i boligmarkedet.
Avslutningsvis sier Xxxxxx at selv om man kan se på leiepris-til-omsetningspris-raten som et mål på verdsettelse av boligmarkedet, skal man ikke forvente at det er en presis indikator på om, når og med hvor mye boligprisene vil endre seg.
3. Teori
I dette kapitlet vil vi presentere teori som er relevant for vår analyse. Ettersom vi ønsker å studere forholdet mellom leieprisen og omsetningsprisen for leiligheter i Oslo, vil vi ta for oss teori som omhandler både eiermarkedet og leiemarkedet. Vi starter med å forklare prisdannelsen i markedet for å eie og å leie bolig, basert på en enkel modell for tilbud og etterspørsel etter bolig. Her inkluderer vi også teori om bokostnader. Videre presenterer vi 4- kvadrant-modellen til DiPasquale og Wheaton. Denne beskriver også sammenhengen mellom tilbud og etterspørsel i boligmarkedet, og skiller spesifikt mellom å leie og eie eiendom. Vi presenterer lokaliseringsteori gjennom Xxxxxx-Xxxx-Mills-modellen før vi går kort inn på teorien om den hedonistiske prisfunksjonen, da vi også skal undersøke hvordan ulike attributter og egenskaper ved en bolig påvirker omsetningsprisen og leieprisen. Deretter går vi inn på teorien utarbeidet av Xxxxxx Xxxxxxx kalt “Marked for lemons”, som omhandler risikoen ved asymmetrisk informasjon mellom kjøper og selger. Helt til slutt presenterer vi hypotesene vi ønsker å undersøke.
3.1 Prisdannelsen i eiermarkedet og leiemarkedet
I de følgende avsnitt går vi nærmere inn på hvordan markedsprisen i boligmarkedet dannes, og vi legger NOU 2002:2 til grunn for videre drøfting. Vi vil først presentere prisdannelsen for eierboliger og deretter prisdannelsen for leieboliger. For å greie ut om hvordan priser i det norske boligmarkedet dannes, er en forenkling nødvendig slik at vi får trukket frem de mest sentrale sammenhengene. Vi antar i dette delkapitlet at alle boliger er like med tanke på attributter og egenskaper, og dermed varierer de kun i pris. Det totale tilbudet av boliger er gitt på kort sikt, både i eier- og leiemarkedet hver for seg. På etterspørselssiden i eiermarkedet har vi alle som ønsker, og har mulighet til, å kjøpe egen bolig. Noen av dem eier allerede en bolig, mens andre står helt uten egen bolig. De som ikke ønsker eller ikke har mulighet til å kjøpe bolig, vil være etterspørrere i leiemarkedet. På tilbudssiden har vi alle de som eier boliger, som enten ønsker å selge eller leie ut boligen sin. Disse består av både privatpersoner og profesjonelle aktører.
3.1.1 Prisdannelsen i eiermarkedet
De som etterspør bolig kan organiseres i en synkende rekkefølge, hvor de som er villige til å betale mest har plass først i rekken. Deres betalingsvilje er tett knyttet til deres evne til å betale, som henger sammen med disponibel inntekt. De som har høy betalingsvilje og
xxxxxxxxxxxxx vil stille først i rekken ved kjøp av bolig. Det er flere faktorer som påvirker behovet for bolig, blant annet i hvilken grad man vektlegger godet bolig sammenlignet med andre konsumgoder og alternative investeringer. Dermed er det ikke gitt at de som har høy disponibel inntekt og betalingsevne har en identisk preferanse for bolig. Figuren under, hentet fra NOU 2002:2, illustrerer etterspørselskurven i eiermarkedet. For hvert nivå på prisaksen, sier kurven noe om hvor mange som etterspør bolig til dette prisnivået eller høyere.
Figur 3.1: Tilbuds- og etterspørselskurve i boligmarkedet
Det samlede boligtilbudet er illustrert ved den loddrette linjen i figuren. Boligtilbudet vil endres som resultat av nybygging og avgang av boliger. Avgangen forekommer gjennom riving, brann og sammenslåing av boliger. Nybygging utgjør kun omtrent 1 % av samlet boligmasse, og vil dermed ikke endre totalt boligtilbud nevneverdig fra år til år. Dette gjør at vi kan anse det som uelastisk på kort sikt. I skjæringspunktet vil vi finne markedsprisen. Alle etterspørrere på venstre side av skjæringspunktet vil kunne kjøpe egen bolig, og de på høyre side vil ikke ha mulighet til å skaffe seg bolig, da markedsprisen er for høy sett i sammenheng med deres betalingsvilje.
Den etterspørreren som spiller en sentral rolle i bestemmelsen av markedsprisen, er den som har lavest betalingsvilje og er den “siste” til å få bolig. Denne kalles den marginale etterspørreren. Markedsprisen vil i realiteten bli bestemt av den marginale etterspørrerens betalingsvilje.
På kort sikt vil det være forhold på etterspørselssiden som i stor grad vil styre prisdannelsen, men på lang sikt må en også ta i betraktning at forhold på tilbudssiden vil være med på å styre prisen. Dersom avgangen av boliger er mindre enn nybyggingen, vil vi sitte igjen med en større boligmasse, slik at tilbudskurven flyttes utover i diagrammet. Langsiktig endres også etterspørselen som et resultat av for eksempel befolknings- og inntektsvekst. Dermed vil vi få et nytt likevektspunkt. Prisen vil justeres, avhengig av størrelsen på endringen i etterspørselen kontra tilbudet. Siden nybygging ofte er en tidkrevende prosess, vil endringen i tilbudet av boliger skje langsomt, og dermed kan kraftige prisbevegelser på kort tid i markedet ofte forklares ved endringer i etterspørrernes betalingsvilje.
3.1.2 Bokostnader
Bokostnader er et sentralt begrep når man skal drøfte hvordan boligmarkedet fungerer. Vi kan definere bokostnadene som verdien av det man må frasi seg av andre goder for å benytte en bolig i en periode (NOU 2002:2). I leiemarkedet er bokostnadene så enkelt som husleien, mens det for boligeiere er noe mer omfattende. Bokostnaden for boligeier gjenspeiler hvor mye det koster å eie og bruke boligen i en bestemt periode sett i forhold til om en hadde stått uten bolig i samme periode. Denne kostnaden består av rentekostnad, drift- og vedlikeholdskostnader, skattefordel ved å eie egen bolig og verdistigning på boligen. Dersom prisene stiger kraftig kan bokostnadene bli negative, ettersom boligen da blir verdt mer.
Rentekostnaden består ikke kun av rente på lånekapital, men også tapt renteinntekt ved å ha egenkapital plassert i boligen.
For husholdninger som skal kjøpe bolig, forutsatt at de ikke har vanskeligheter med tilgang på kreditt, er det sentrale spørsmålet hvor store bokostnadene blir totalt, og ikke størrelsen på enkeltkomponentene. Dermed kan kjøpernes betalingsvilje beskrives som størrelsen på bokostnadene de er villige til å pådra seg. Ettersom fremtidig prisstigning på boligen ikke er kjent på tidspunktet for kjøp av bolig, vil beslutningen om boligkjøp i stor grad basere seg på forventningene om hva prisene vil bli. De forventede bokostnadene er derfor relevante for boligetterspørselen. Bokostnadene er mer usikre for eiere enn for leietakere, ettersom det kan skje noe med boligen som krever dyre reparasjoner eller at verdien på boligen synker.
For husholdninger som har vanskeligheter med å få kreditt er fortsatt bokostnaden av betydning, men disse må også i større grad ta hensyn til boutgiftene. Dette er kontante utbetalinger som en husholdning har tilknyttet boligen gjennom en periode, som ikke er til å
unngå. Disse boutgiftene reduserer de kredittrasjonerte husholdningenes betalingsvilje. På den måten vil fremtidig forventet prisstigning og rentenivå ha svakere innvirkning på betalingsviljen til disse husholdningene. Avdrag og minstekrav til egenkapital, og størrelsen på disse, kan derimot påvirke deres betalingsvilje sterkt.
3.1.3 Prisdannelsen i leiemarkedet
Det som i hovedsak bestemmer om man vil leie eller eie er evnen til å bære risiko, tilgang på kreditt og tidsperspektiv på leie av bolig. Husholdninger med sikre inntekter og stor formue, vil mest sannsynlig finne det tryggest å eie. Er man utsatt for kredittrasjonering, kan man derimot synes det er bedre å leie fremfor å eie. I tillegg finnes også de som ikke har noe annet valg enn å leie. Ettersom det tar tid å selge og kjøpe bolig, vil man kunne anta at de som ønsker å leie er husholdninger som regner med å flytte relativt fort, eller har en usikker tilknytning til arbeidslivet. Kostnadene ved å eie og leie er ikke de samme, og en viktig forskjell ligger i det at man generelt er mer opptatt av å ta vare på egen eiendom fremfor andres. Dermed vil komponenten for drift og vedlikehold i bokostnadene være generelt høyere for utleiere enn boligeiere som ikke leier ut, og bidra til å heve husleien.
Skattefordelene er også høyere for boligeiere som ikke leier ut enn for utleiere, som igjen bidrar til å påvirke husleien. Dette medfører økte kostnader og økte husleier. Dermed er antallet som velger å leie bolig lavere enn det ellers ville vært. Leien må være høy nok til at skattebetalere etter hovedregelen anser det å drive utleie som gunstig.
En stor andel av de utleide boligene i Norge er sokkelboliger, som vil si at eieren bor i hoveddelen av boligen selv. Disse boligene er normalt uaktuelt å gjøre om til eierboliger. På motsatt side av markedet, har borettslagene krav om at eierne selv skal bo i boligen, eller at fremleie er tillatt i en begrenset periode. Små borettslagsleiligheter og sokkelleiligheter utgjør noen steder en betydelig del av antallet mindre leiligheter, og for potensielle leietakere er det ofte små leiligheter som er av interesse. Tilbudet av utleieboliger kan reagere relativt tregt på endringer i husleier eller boligpriser, da noen boliger sjelden skifter status fra eierbolig til leiebolig.
Som nevnt tidligere, antar vi fortsatt at tilbudet av leie- og eierboliger er gitt hver for seg på kort sikt, og kan ikke endres. Dermed er figur 3.1 like gjeldende for å illustrere den forenklede dynamikken i markedet for leieboliger. Prisen må da tolkes som månedsleie.
Husleien bestemmes av betalingsviljen til potensielle leietakere. Her vil betalingsviljen
avhenge sterkt av bokostnader for tilsvarende boliger, og kan dermed ikke avvike for sterkt fra disse. Forskjellen på bokostnadene for leie- og eierboliger vil uansett avhenge av hvor mange som har spesiell grunn til å leie, sammenlignet med hvor mange leieboliger som ligger tilgjengelig. Om det skulle være mange som vil leie, men det er få leieboliger ute, vil husleiene naturlig bli relativt høye. Høye husleier vil på den andre siden gjøre det lønnsomt å kjøpe boliger og leie dem ut, som øker tilbudet av utleieboliger. Dette vil etterhvert føre til at husleiene, som er bokostnadene for leietakere, blir relativt lavere enn bokostnadene for eierboliger. Dermed vil man på et tidspunkt komme til et punkt der differansen mellom husleien, bokostnaden for eiere og prisstigningen blir bestemt av forskjellene i skattekostnadene og drift- og vedlikeholdskostnadene.
Av disse treghetene følger det at lokale endringer i sammensetningen av befolkningen i løpet av en periode, kan ha stor innvirkning på forholdet mellom husleier for leietakere og bokostnader for eiere. Dersom det skulle strømme til flere unge, for eksempel som følge av nye skoletilbud, vil husleiene stige betydelig mer enn bokostnadene. Dette er fordi unge ofte ikke har nok egenkapital, mangler tilgang på kreditt og snart skal flytte på seg. Disse vil være villige til å betale en husleie som er høyere enn bokostnaden for eiere. Disse økte husleiene vil etterhvert fremkalle en økning i tilbudet av utleieboliger. Da det er et utbredt tilbud av studiemuligheter i Oslo, kan dette være noe av grunnen til at husleiene er så høye i Oslo i forhold til resten av landet.
3.2 DiPasquale-Wheaton-modellen
DiPasquale-Wheaton-modellen, også kalt 4-kvadrant-modellen, er et konseptuelt rammeverk som forsøker å forklare sammenhengen mellom beholdning av boliger målt i areal og leiepris, leiepris og omsetningspris, omsetningspris og nybygging, og mellom nybygging og arealbeholdning av bolig. Den er en langsiktig likevektsmodell som integrerer markedet for bruk av boligareal og eiermarkedet for eiendom, og er dermed svært aktuell for vår avhandling. Modellen er utarbeidet av DiPasquale og Wheaton (1996).
Under illustreres modellen grafisk, med fire såkalte kvadranter. De to kvadrantene til venstre representerer markedet for eierskap av eiendom, og kvadrantene til høyre i figuren representerer markedet for bruk av boligareal.
Figur 3.2: Grafisk fremstilling av 4-kvadrant-modellen
Først er det hensiktsmessig å definere de ulike aksene i hver kvadrant. I den nordøstlige kvadranten står x-aksen for arealbeholding av bolig målt i kvadratmeter, og y-aksen for leieprisen i kroner. Her fastsettes leieprisen i markedet. Den nordvestlige kvadranten har akser med leiepris i kroner og omsetningspris per kvadratmeter i kroner, og her foregår verdsettelsen av boliger. I den sørvestlige kvadranten finner vi aksene omsetningspris per kvadratmeter i kroner og mengden nybygging målt i kvadratmeter. Her fastsettes nivået av nybygging av boliger. Den sørøstlige kvadranten består av akser for mengden nybygging målt i kvadratmeter og arealbeholding av bolig målt i kvadratmeter. I denne kvadranten bestemmes eventuelle justeringer av beholdningen av boligareal, som følge av endringer i de andre faktorene i modellen.
Analysen av modellen starter med fastsettelse av leieprisen i markedet for bruk av boligareal i den nordøstlige kvadranten. Her forutsettes det at tilbudet av boligareal er uelastisk, og består av en eksisterende bygningsmasse på kort sikt. Den fallende kurven representerer hvordan etterspørselen etter bruken av boligareal avhenger av leieprisen (R), og andre eksogent
bestemte makroøkonomiske faktorer, som inntektsnivå, produksjonsnivå eller antallet husholdninger i markedet:
(3.1) 𝐷 = 𝑓(𝑅, 𝑚𝑎𝑘𝑟𝑜)
Bevegelse langs kurven viser hvor stort areal som etterspørres gitt et bestemt leienivå på y- aksen. Dersom kurven er flat har vi elastisk etterspørsel, det vil si at arealbruken er sensitiv til endringer i leien. Ved uelastisk etterspørsel er kurven nærmere vertikal, og etterspørselen er relativt lik uansett leienivå. Med utgangspunkt i det gitte tilbudet av boligareal, bestemmer markedet et leienivå der etterspørselen for bruk av boligareal, D, tilsvarer tilbudet, S:
(3.2) 𝐷 = 𝑓(𝑅, 𝑚𝑎𝑘𝑟𝑜) = 𝑆
Siden tilbudet er gitt, finner vi leienivået ved å dra en strek fra x-aksen opp til etterspørselskurven, og deretter fra kurven til y-aksen.
Med leienivået bestemt, går analysen over til eiermarkedet og den nordvestlige kvadranten. Her viser modellen verdsettelse av boliger i eiermarkedet. Det er en klar sammenheng mellom eiermarkedet og markedet for bruk av boligareal. Leienivået som bestemmes i leiemarkedet er sentralt for å bestemme etterspørselen etter å eie bolig. I realiteten kjøper investorer en fremtidig inntektsstrøm ved kjøp av bolig. Følgelig påvirker endringer i leien umiddelbart etterspørselen etter eierskap av bolig. Gitt et nivå på leieprisen (R) fastsatt i leiemarkedet, er omsetningsprisen (P) per kvadratmeter gitt av rentefaktoren (i), som vil si at leieprisen er kapitalisert:
(3.3) 𝑃 = 𝑅
𝑖
Helningen til kurven som starter i origo representerer renten for eierboliger, og representerer dermed forholdet mellom leiepris og omsetningspris. Rentefaktoren, i, defineres som den nåværende avkastningen etterspurt av investorer for å kunne eie eiendom, og er eksogent gitt. Avkastningen avhenger av langsiktig rente, forventet strøm av leieinntekt, risikoen forbundet med strømmen av leieinntekt, og skattebehandlingen av eiendom. En forutsetter i modellen at boligene er evigvarende, da en kun dividerer med i, og en forutsetter dermed et langsiktig
perspektiv for at formelen skal gjelde. 𝑃 = 𝑅 representerer dermed nåverdien av en uendelig
𝑖
årlig inntektsstrøm på R kroner. I figuren finner vi omsetningsprisen ved å dra en strek fra leienivået på den vertikale aksen, fastsatt tidligere, til kurven i den nordvestlige kvadranten og ned til den horisontale aksen med omsetningspris.
Ved tredje punkt i analysen avdekkes behovet for nybygging i den sørvestlige kvadranten. Tilbudet av nye eiendommer kommer fra byggesektoren, og avhenger av eiendomsprisene relativt til kostnaden for å erstatte eller bygge dem. Kurven f(C) representerer alternativkostnaden til eiendom, og er en tilbudskurve for nybygging:
(3.4) 𝑃 = 𝑓(𝐶)
I diagrammet antar en at alternativkostnaden, som tilsvarer kostnaden for bygging av nye boliger, øker med høyere byggeaktivitet (C), og dermed beveger kurven seg i en sørvestlig retning. Kurven skjærer prisaksen ved den minste kroneverdi per kvadratmeter som er nødvendig for å få i gang et visst nivå av nybygging. Dersom det er behov for tilnærmet lik kostnad for nybyggingen ved ethvert nivå, vil kurven være mer vertikal. En mer horisontal kurve får vi dersom tilbudet av ressurser til byggingen er uelastisk, som følge av for eksempel byggeflaskehalser, begrenset tilgang til land og andre hindringer til nybygging. Med utgangspunkt i omsetningsprisen som ble fastsatt i den nordvestlige kvadranten, finner en mengden av nybygging som gir alternativkostnad lik omsetningspris ved å dra en strek fra prisaksen til kurven for alternativkostnaden til eiendom, og videre herfra til den vertikale aksen for nybygging. Høyere nivåer av nybygging vil ikke være lønnsomt, og lavere nivåer vil føre til svært høy fortjeneste. Dermed må nybygging foregå på det nivå, C, der omsetningspris, P, er lik alternativkostnaden, f(C).
Avslutningsvis finner vi endringen i tilbudet av boligareal i den sørøstlige kvadranten. Her blir den årlige mengden av nybygging, C, konvertert til en langsiktig mengde boligareal. For å finne nettoveksten i boligareal, ΔS, i en gitt periode, må en trekke avskrivningen av boligene fra nybyggingen i perioden. Avskrivningen defineres som δS, der δ betegner avskrivningsgraden og S betegner det eksisterende boligarealet tilgjengelig for bruk:
(3.5) ∆𝑆 = 𝐶 − 𝛿𝑆
Kurven som strekker seg ut fra origo representerer den mengden av boligareal på den horisontale aksen som krever et årlig nivå av nybygging akkurat lik som verdien på den vertikale aksen. Ved dette nivået av areal og nybygging vil arealbeholdningen være konstant over tid, siden avskrivningene som faller ut av markedet hvert år vil tilsvare nybyggingen.
Følgelig har vi en forutsetning om en nettovekst i boligarealet på null, det vil si at ΔS=0, og vi finner at:
(3.6) 𝑆 = 𝐶
7
Med dette fullføres hele rotasjonen rundt 4-kvadrant-diagrammet. Eiermarkedet for boliger og markedet for bruk av boligareal er i likevekt dersom start- og sluttnivået av boligarealet er likt, som i figur 3.2. Da er også verdien av de fire variablene leiepris, omsetningspris, nybygging og boligareal i likevekt. Dersom sluttverdien av boligarealet skiller seg fra startverdien, vil ikke de fire variablene i diagrammet være i fullstendig likevekt. Det forutsettes at likevekten i modellen opprettholdes over flere perioder. Modellen illustrerer likevekt på lang sikt, og er ikke egnet til å beskrive dynamikken i markedet på kort sikt eller midlertidig skjevhet i markedet. Modellen gjelder uavhengig av hvem som bruker boligarealet, enten de er leietakere eller eiere, firmaer eller husholdninger.
Det er videre relevant å illustrere hva som kan forårsake endringer i kurvene i de ulike kvadrantene, og virkningene av disse endringene på likevekten i modellen. Flere ulike mekanismer i et lands økonomi kan påvirke eiendomsmarkedet. I hvert tilfelle kan en identifisere hvilken kvadrant som påvirkes i første omgang, og deretter avdekke virkningen av dette i de andre kvadrantene. Etter å ha avdekket endringene i alle deler av modellen, vil vi lande på en ny langsiktig likevekt.
Dersom det forekommer økonomisk vekst har vi en endring i etterspørselen etter bruken av eiendom. En kan anta at økonomisk vekst fører til eksempelvis en økning i generell inntekt, produksjonsnivå for firmaer og antallet husholdninger, som øker etterspørselen etter bruken av boligareal ved et bestemt leienivå. Dette fører til et parallelt skift i etterspørselskurven (D) utover i diagrammet i den nordøstlige kvadranten. For et gitt nivå av boligareal, må leien derfor øke dersom etterspørselen etter bruk av boligareal skal være lik tilgjengelig areal.
Virkningen av skiftet i etterspørselen vil dermed være høyere leiepris, som videre fører til høyere omsetningspris på boliger, økt nybygging, og til slutt høyere tilbud av boligareal. Det betyr at alle variablene øker som følge av en økning i etterspørselen grunnet økonomisk vekst. Ettersom både leiepris og omsetningspris øker i verdi, vil forholdet mellom variablene vil være likt som før skiftet.
Skiftet, og virkningene av det, illustreres i figur 3.3 nedenfor. Siden alle variablene øker, genererer den nye likevekten en firkant som ligger utenfor den tidligere likevekten i alle kvadrantene, men den nye løsningen trenger på ingen måte å være en proporsjonal utvidelse
av den originale likevekten. En proporsjonal utvidelse er vist med den heltrukne grå firkanten i figuren, og denne løsningen vil ikke gi likevekt. Formen på den nye firkanten avhenger av elastisiteten til de ulike kurvene i modellen, og løsningen vil være den som gir likevekt med økning i alle variablene. Dette er vist med den stiplede grønne likevekten i figuren. Ved negativ økonomisk vekst har vi motsatt virkning, med lavere verdier for alle variablene.
Figur 3.3: Virkningen av et skift i etterspørselskurven i den nordøstlige kvadranten ved en økning av etterspørselen
Dersom etterspørselen etter å eie bolig endrer seg, vil vi få et skift i kurven for avkastningen,
i. Flere faktorer kan endre denne etterspørselen, og en endring av etterspørselen er resultatet av endringer i avkastningen for eiendom. En endring i avkastningen for investorer kan være et resultat av endret langsiktig rente, forandringer i eiendomsskatter og nye oppfatninger om risikoen knyttet til eiendom. Enhver av disse forandringene kan gjøre at investorer skifter sin investeringsaktivitet bort fra, eller inn mot, eiendomssektoren. Dette fordi det har blitt mer, eller mindre, lønnsomt å investere i eiendom relativt til andre investeringsobjekter. Lavere langsiktige renter, redusert risikooppfatning av eiendom og gunstige endringer i
skattebehandlingen av eiendom resulterer i lavere avkastning, i. Ved en økning i avkastningen vil situasjonen være motsatt. Ved en endring av i får vi en rotasjon av kurven i den nordvestlige kvadranten. En reduksjon av i gir en rotasjon av kurven mot klokka, vist i figur
3.4 nedenfor. Rotasjonen fører til høyere omsetningspris, som videre vil øke nybyggingen. Etter hvert fører dette med seg økt arealbeholdning av bolig, som til slutt vil redusere leieprisen. Dette er illustrert med den stiplede grønne firkanten, som representerer den nye likevekten. Dersom i øker, har vi motsatt effekt på kurven og de andre variablene i modellen.
Figur 3.4: Virkningen av en rotasjon av kurven i den nordvestlige kvadranten ved en reduksjon av i
Ved en slik rotasjon endres forholdet mellom leiepris og omsetningspris, da omsetningsprisen øker, mens leieprisen reduseres. Både ved en reduksjon av i og en økning av i vil disse to faktorene bevege seg i motsatt retning, og forholdet vil endre seg. Dette er svært sentralt for avhandlingen, og viktig å presisere. Siden det er en mer langsiktig rente som vil påvirke i, kan endringer gå noe langsomt her. Vi har altså at dersom realrentenivået faller eller øker, vil forholdstallet mellom leiepris og omsetningspris endres.
Det neste som kan påvirke eiendomsmarkedet er en endring i byggekostnadene, som kan forekomme gjennom flere kanaler. Ved introduksjon av mer restriktive reguleringer for bygging, eller en økning av prisen på byggematerialer, vil kostnadene ved å oppføre en gitt mengde nytt byggeareal øke. Lønnsomheten og mengden av nybygging for et gitt nivå av omsetningsprisen vil i tillegg bli redusert. Mer tilgjengelig finansiering av nybygging eller introduksjon av mindre restriktive reguleringer for bygging vil på den andre siden føre til reduserte byggekostnader. En endring av byggekostnadene vil føre med seg et parallelt skift i kurven for tilbudet av nybygging. En økning av byggekostnadene gir et skift i kurven utover i kvadranten, vist i figur 3.5 nedenfor. Skiftet vil føre til redusert nybygging for et gitt nivå av omsetningsprisen, og etter hvert også redusert beholdning av boligareal. Med lavere arealbeholdning, må leieprisen øke, som tilslutt vil resultere i høyere omsetningspriser. Denne nye likevekten er illustrert med den stiplede grønne boksen i figuren nedenfor, som nå ligger nordvest for den opprinnelige likevekten. Størrelsen på endringene avhenger av kurvenes elastisitet. Her vil omsetningspris og leiepris bevege seg i samme retning, og forholdet mellom dem vil ikke endres.
Figur 3.5: Virkningen av et skift i tilbudskurven i den sørvestlige kvadranten ved en økning av byggekostnadene
I tillegg til de økonomiske implikasjonene illustrert med skift og rotasjon av kurvene over, kan offentlig politikk, utenom det som er nevnt, være direkte eller indirekte rettet mot eiendomsmarkedet. Noen av virkemidlene kan være å øke tilbudet av offentlig eide og finansierte sosialboliger eller av boliger for grupper med lav inntekt, å subsidiere leie for utsatte grupper, arealplanlegging, nye skattebestemmelser, reguleringer og restriksjoner.
Denne politikken har ulike effekter på etterspørselskurven i modellen. Med økt tilbud av offentlige boliger, for eksempel gjennom økt nybygging, vil etterspørselen etter privateide leieboliger reduseres. Dette gir et skift innover i kurven for etterspørselen etter bruk av boligareal i markedet, ekskludert det “offentlige”. Dette fører med seg redusert leiepris, redusert omsetningspris, redusert nybygging i privat sektor og redusert privat tilbud av boligareal. Subsidiering av leie for enkelte grupper vil ha en motsatt effekt, der etterspørselskurven skifter utover, og alle faktorene i modellen vil følgelig øke i verdi.
Enkeltstående skift som har blitt vist og forklart i denne modellen, som følge av endringer i makroøkonomien, kan skje uavhengig av andre skift. Det er imidlertid mer sannsynlig at økonomiske hendelser forårsaker flere skift som inntreffer mer eller mindre samtidig.
Analysen blir naturligvis mer komplisert når virkningen av flere skift skal illustreres samtidig, men utfallet vil alltid være en kombinasjon av virkningene av hver enkeltstående endring i de ulike delmarkedene. Modellen som har blitt beskrevet her forklarer nyttige sammenhenger i eiendomsmarkedet, og legger et godt grunnlag for essensen i denne avhandlingen.
3.3 Xxxxxx-Xxxx-Mills-modellen
Det finnes flere ulike attributter som kan ha innvirkning på prisen på en bolig. Xxxxxx-Xxxx- Mills-modellen tar for seg hvor en bolig er lokalisert i forhold til sentrum og hvilken påvirkning dette har på boligprisen. Dette vil være av relevans til vår avhandling, da boligprisen for leiligheter, så vel som andre boligtyper, har vist seg å variere mellom de ulike bydelene i Oslo. Modellen er utarbeidet basert på en rekke forutsetninger og er i stor grad forenklet for å kunne få frem de sentrale sammenhengene når man skal se på hvordan lokaliseringen påvirker leieprisen. Modellen er beskrevet av DiPasquale og Wheaton (1996), Xxxxxxxxx og Xxxxxxx (2010) og Xxxxxx (1964).
Modellen forutsetter at en by har ett forretningsdistrikt i sentrum. Det vil si at byen er monosentrisk, med alle arbeidsplasser lokalisert i sentrum. En kan tenke seg at en by har tre nivåer, med forretningsdistrikt i sentrum, omkringliggende by og jordbruksland. Alle i byen
har samme transportkostnader per kilometer inn til sentrum. Det vil si at de som bor lenger fra sentrum vil betale mer for reisen enn de som bor nærmere, eller i, sentrum. Dette fører til at de som bor nærmere bygrensen vil ha lavere betalingsvilje for bolig, ettersom de har en høyere total transportkostnad for å komme seg til arbeid. I motsatt tilfelle har vi at de som bor nærme sentrum vil ha betydelig mindre transportkostnad, og vil dermed ha høyere betalingsvillighet for bolig. Det skal i likevekt være slik at ingen konsumenter kommer bedre ut enn andre, enten de bor langt unna eller nærme sentrum, siden det forutsettes at alle husholdninger er identiske med tanke på inntekt og andre forhold. I tillegg skal summen av leiepris og transportkostnader være lik for alle.
Modellen bygger på en rekke forutsetninger:
- Byen er monosentrisk.
- Tilbudet av bygningskonstruksjoner er gitt, og bestemmes av historisk bygging.
Tilbudet av land er også gitt.
- Konsumentene reiser langs en rett linje til forretningsdistriktet, med kostnaden k per km per år, og denne er lik for alle husholdninger.
- Reiseavstanden for husholdningene kaller vi for d. Denne avstanden er den konsumenten må reise for å komme seg til arbeid.
- Alle husholdninger er identiske og en husholdning sin inntekt y benyttes til transportkostnader kd, husleie og alle andre goder x.
- Alle boliger er identiske og husleie varierer med avstand til sentrum. Husleien er gitt ved R(d).
- Den som har høyest betalingsvillighet er den som får bolig.
- Fordelene ved bolig består av tomtestørrelse per hus q og selve bygningen c.
- Alle lokaliseringer er helt differensierte og prisen for land varierer mellom steder avhengig av plasseringen.
- Etterspørselen etter en bestemt plassering av land er priselastisk.
- Bygrensen ligger der hvor d=b.
- Utenfor bygrensen er jordbruk den alternative bruken av land.
- Alternativkostnaden for land utenfor bygrensen antar vi er ra per m2 (rural leie).
Kostnadene ved å feste tomt ved bygrensa er raq, der ra er avkastningen av å dyrke landet ved grensen, og q er størrelsen på tomta. Følgelig har vi at leie av eiendom på bygrensen er lik
summen av tomtefeste og byggekostnad: 𝑟𝑎𝑞 + 𝑐, der c er lik den årlige kostnaden for å oppføre en bygning.
Annet konsum blir dermed: 𝑥= = 𝑦 − 𝑘𝑏 − (𝑟𝑎𝑞 + 𝑐), og er identisk for alle husholdninger. Til slutt kommer vi frem til at uttrykket for leien av eiendom ved avstanden d fra sentrum er:
(3.7) 𝑅(𝑑) = 𝑦 − 𝑘𝑑 − 𝑥= = 𝑦 − 𝑘𝑑 − 𝑦 + 𝑘𝑏 + (𝑟𝑎𝑞 + 𝑐)
(3.8) 🡪 𝑹(𝒅) = (𝒓𝒂𝒒 + 𝒄) + 𝒌(𝒃 − 𝒅)
Den siste funksjonen representerer kurven for leie av eiendom. Kurven og de ulike komponentene av leien kan illustreres slik:
Figur 3.6: Kurven for husleie og de ulike komponentene husleien består av
Den heltrukne kurven i figuren representerer husleiekurven fra forretningsdistriktet til bygrensen og forbi grensen. Ut ifra kurven for husleie følger det at leien synker når avstanden fra sentrum øker. Dersom vi deriverer husleiefunksjonen med hensyn på d finner vi stigningstallet til kurven:
(3.9) 𝛛𝑅(𝑑) = −𝑘
𝛛(𝑑)
Det vil si at leieprisen synker med økende avstand fra sentrum, d, som forklart tidligere. Denne modellen er svært forenklet sammenlignet med virkeligheten. Ifølge Xxxxxx (1964), vil husleiekurven i realiteten ikke være lineær, men ha negativ eksponentiell vekst. Dette medfører at kurven blir brattere nærmere forretningsdistriktet enn ved bygrensen. Ved en eventuell utvidelse av bygrensen, vil dermed leieprisen nærme forretningsdistriktet øke betydelig mer enn leieprisen nærme bygrensen.
Da påvirkningen av boligens avstand til sentrum ikke er det viktigste i avhandlingen, utdyper vi ikke denne modellen ytterligere her. En utdypelse og videreføring av modellen er beskrevet i Location and Land Use av Xxxxxxx Xxxxxx (1964), Urban Economics and Real Estate Markets av DiPaquale og Wheaton (1996) og Boligmarkedet i Kristiansand av Xxxxxxxxx og Xxxxxxx (2010).
3.4 Hedonistisk prisfunksjon
Det er langt flere attributter enn avstand til sentrum som bestemmer markedsverdien av eiendom. I boligmarkedet blir også attributter som nabolag, solforhold, nærhet til andre tjenester som buss, skole og butikk verdsatt. I tillegg varierer bygningsattributter fra en eiendom til en annen. Alle disse faktorene må hensyntas når en skal forstå og forklare prisdannelsen for eiendommer i et byområde. For dette trengs modeller som forklarer prisdannelsen på attributtene til heterogene goder. Ifølge Xxxxxxxxx og Xxxxxxx (2010), var Lancaster (1966) den første som fremstilte konsumenters tilpasning for heterogene goder på en sammenhengende måte, men Rosen (1974) mente denne modellen manglet tilstrekkelig utledning av mekanismene for markedslikevekt. Xxxxxx modell tar blant annet for seg markedsmekanismer mellom kjøpere og selgere av heterogene goder, og er ofte den som omtales som klassikeren når det kommer til forklaring om prisvariasjonene for heterogene goder, som boliger.
I det følgende vil vi kort presentere en svært forenklet versjon av Xxxxxx modell, utarbeidet av Xxxxxxxxx og Xxxxxxx (2010), for å kunne få frem det mest sentrale. En grunnleggende antakelse i modellen er at heterogene goder kan forstås som en vektor av de forskjellige attributtene:
(3.10) 𝑍 = (𝑧1, 𝑧2, … , 𝑧𝑛)
Videre utleder Xxxxx markedsprisen for godet som en funksjon av dets sammensetning av attributter:
(3.11) 𝑃(𝑍) = (𝑧1, 𝑧2, … , 𝑧𝑛)
Denne funksjonen, P(Z), kalles den hedonistiske prisfunksjonen. Figur 3.7 viser en forenklet modell av funksjonens utledning for tilfeller med kun ett attributt. Høyre side av figuren viser tilbudskurvene (T) og etterspørselskurvene (E) for boliger på henholdsvis 100 og 70 kvadratmeter. Disse settene med tilbuds- og etterspørselskurver gir en likevektspris P*.
Figuren viser P*100 for bolig på 100 kvadratmeter, og P*70 for bolig på 70 kvadratmeter. Til venstre i figuren, der vi måler boligareal langs x-aksen, finner vi punktene A og B. Disse punktene gjenspeiler den sammenhørende verdien av boligareal og boligpris. Ved å tegne inn tilbuds- og etterspørselskurver for flere boligstørrelser til høyre i figuren kan vi finne flere andre punkter, slik som D på venstre side. Disse punktene (A, B, D,...) utgjør den hedonistiske prisfunksjonen. Denne funksjonen er trukket opp som en evig stigende kurve til venstre i figuren under.
Figur 3.7: En forenklet modell av den hedonistiske prisfunksjonen
Denne forenklede utledningen av den hedonistiske prisfunksjonen forutsetter at det er likevekt i alle deler av boligmarkedet, i likhet med Rosens modell. Da Xxxxxx modell tar for seg flere attributter, tar denne modellen som nevnt kun for seg ett attributt. Dermed må det understrekes at dette er en meget forenklet versjon. Likevektsprisene for boliger med forskjellige attributter legger til rette for at det blir likhet mellom tilbud av og etterspørsel etter alle typer boliger i markedet, og følgende for alle attributter. Dette er en meget streng
forutsetning, og i et konkret marked vil den som oftest ikke være perfekt oppfylt. Samme forutsetning ligger til grunn for utledningen av den hedonistiske prisfunksjonen i Rosen (1974). Både denne forenklede modellen og Rosens modell resulterer i en hedonistisk prisfunksjon som illustrerer hvordan prisen på en bolig vil være avhengig av mengden av alle attributtene knyttet til den. Ved å partiellderivere den hedonistiske prisfunksjonen, vil man finne marginalprisene på de ulike attributtene. Generelt vil man kunne se at marginalprisen på et attributt vil variere med mengden av attributtet. Derfor ser man i figur 3.7 at den hedonistiske prisfunksjonen er illustrert som en ikke-lineær funksjon av attributtet kvadratmeter.
3.5 Marked for “lemons”
Xxxxxx X. Xxxxxxx presenterte i 1970 en teori der han diskuterte et “lemons” marked, der han omtalte en “lemon” som en dårlig bruktbil, full av mangler. Teorien baserer seg på asymmetrisk informasjon mellom kjøper og selger, hvor kjøper ikke klarer å bedømme om det er en god eller dårlig bruktbil ved første øyekast, uten å kunne ha mulighet til å prøve den.
Asymmetrien ligger her i at selger er kjent med bilen og dens egenskaper, mens kjøper er totalt uvitende. Akerlof understreker at dette markedet, bruktbilmarkedet, er valgt som eksempel fordi det er så konkret og lett forståelig, ikke fordi det nødvendigvis gir et 100% riktig bilde av virkeligheten. Akerlof tar for seg et marked der det selges og kjøpes bruktbiler. Det finnes to selgere i markedet, der selger 1 tilbyr en god bruktbil og selger 2 tilbyr en dårlig bruktbil. Til slutt har vi en kjøper uten kjennskap til noen av bilenes egenskaper eller kvalitet. I følge Biong (2009), er en vurdering av kvalitetsbegrepet her nødvendig. Man kan si at begrepet er todimensjonalt bestående av nivå og konsistens. Nivå kan for eksempel beskrive slitestyrke på et materiale, eller en bestemt standard som skal oppfylles ved levering av en tjeneste. Med konsistens mener man at det skal være liten forskjell i avtalt nivå fra leveranse til leveranse. Ved å referere til en leveranse med høy kvalitet, mener man en leveranse på det avtalte nivået, og at dette nivået er det samme for alle leveranser. Det antas videre at det er høyere kostnader knyttet til å levere høy kvalitet enn lav kvalitet, fordi den høye kvaliteten ofte setter strengere krav til blant annet kompetanse, produksjonsrutiner og materialvalg.
Xxxxxxx legger frem et scenario der kjøper vet at han må betale litt mer for en god bil og ikke fullt så mye for en dårligere bil, men ettersom kjøper ikke kan se hvilke av bilene som er gode eller dårlige, vil kjøper legge seg på en pris som er på snittet av hva en god og en dårlig bil ville kostet. Dermed vil kjøper tilby selger 1, med den gode bilen, for lite etter selger 1 sitt
ønske, og dermed ikke få kjøpt den gode bilen. Selger 2, som selger en “lemon”, vil imidlertid bli tilbudt en pris som ligger høyere enn hva bilen egentlig er verdt, og vil følgelig få solgt den dårlige bilen til den uvitende kjøperen. Greshams lov (Xxxxx, 1994) resulterer i at alle de gode bilene på sikt vil bli presset ut av markedet, slik at det kun vil være et marked for “lemons”. I verste fall vil markedet kollapse. Xxxxxxxx lov er et monetært prinsipp som går ut på at dårlige penger presser de gode pengene. Dette omhandler verdsettelse av valuta. Eldre mynter inneholdt større mengde edelt metall, og ble ansett som gode penger, mens nye mynter ble ansett som dårlige penger. I utgangspunktet var Xxxxxxxx lov basert på at dersom en ny mynt fikk samme pålydende verdi som en eldre mynt, så ville de nye myntene bli brukt, og de eldre myntene bli samlet på. Til slutt ville alle de eldre myntene slutte å sirkulere i markedet og forsvinne helt. Det finnes imidlertid løsninger på hvordan den asymmetriske informasjonen kan jevnes ut, og hindre at de gode bilene blir presset ut av markedet. Dette kan blant annet gjøres ved at leverandøren av gode biler opparbeider seg et renommé for å være en som leverer kvalitetsvarer.
For å knytte denne teorien opp mot utleiemarkedet, kan en først si at han som står i kjøpers posisjon i eksempelet til Xxxxxxx kan representere utleier, og at det er leietaker som kan være en god eller dårlig leietaker. Dette er det kun leietaker som har informasjon om. Leietakere kan være mennesker med begrenset tilgang på kreditt slik at å kjøpe bolig ikke er et alternativ, og dette kan i noen tilfeller være fordi leietaker ikke har kontroll over sin økonomiske situasjon. Det er disse leietakerne som knytter risiko til det å være utleier. I tilfeller hvor leietakere er studenter, er sannsynligheten for problemer betydelig mindre. En risiko for utleier ved å leie ut egen bolig kan være at han ikke er sikker på at leien blir betalt. For å minimere denne risikoen er det flere strategier utleier kan benytte seg av. En ting utleier kan gjøre er å stille krav om referanser fra tidligere leieforhold. Det gjør at utleier kan få informasjon som leietaker kan ha motiv for å holde tilbake. Et annet alternativ kan være å sette leieprisen på et lavere nivå, og kreve et større depositum som sikkerhet. Et tredje alternativ kan være å legge leieprisen høyt. Om man da oppdager at det er en god leietaker, kan utleier i ettertid senke leien for å beholde leietakeren. Depositum kan også fungere som et incentiv for leietaker til å ta bedre vare på boligen som leies, og kan sortere ut de leietakerne som kun har nok penger til å dekke løpende forbruk. Dermed vil utleier sitte igjen med betalingsdyktige leietakere. Ifølge Xxxxxxxx teori kan vi dermed si at en utleier på sin side må sikre seg slik at han sitter igjen med tilstrekkelig med midler for å dekke sine kostnader.
I noen tilfeller, men svært få, kan man også si at utleier spiller en lignende rolle som bruktbilselger, og at leietaker tar rollen som den som skal kjøpe bruktbil. Ved leie av bolig er det en del egenskaper ved boligen som kun utleier kjenner til, være seg bråk fra naboer eller dårlig ventilasjon som gjør det kaldt på vinterstid. Dette er noe leietaker ikke har informasjon om ved første øyekast. Dermed sitter utleier inne med mer informasjon enn leietaker om utleieboligen, som kan ha betydning for leietakers nytteverdi. Det leietaker kan gjøre for å balansere ut den asymmetriske informasjonen er for eksempel å kontakte tidligere leieboere. Disse sitter på informasjon om leiligheten som den nye leietakeren kan dra nytte av, og de har heller ingen incentiver til å holde tilbake informasjon, da de uansett er ferdig med sitt leieforhold med tidligere utleier.
Noen av de samme problemstillingene kan dukke opp ved kjøp og salg av bolig, da selger og tidligere eiere sitter på mer informasjon enn en potensiell kjøper. I Norge er kjøp og salg av eiendom betydelig mer lovregulert enn utleie av bolig. Om det tilbakeholdes informasjon som kan ansees som vesentlig hemmende for den alminnelige bruken av boligen står det i De Norske Lover at kjøper senere har rett til å heve kjøpet, eller få erstatning for det tapet kjøper har lidt som følge av den tilbakeholdte informasjonen. Likevel skal det nokså mye til for å få dette gjennom. Det ligger også et visst ansvar på kjøper i denne situasjonen, da det også er lovpålagt av kjøper å undersøke boligen tilstrekkelig før kjøpet gjennomføres. Dette for å kunne ha rett til å gjøre eventuelle mangler gjeldende etter kjøpet er gjennomført (Justis- og beredskapsdepartementet, 2012)
3.6 Hypoteser
Problemstillingene i oppgaven lyder som følger:
1. Hvilke faktorer bestemmer omsetningsprisen? Hvilke faktorer bestemmer leieprisen?
2. Hvilket forhold er det mellom leiepris for leiebolig og omsetningspris for eierbolig?
Som nevnt, er det problemstilling nummer 2 som er hovedproblemstillingen i avhandlingen. Problemstilling nummer 1 må derimot avdekkes før vi kan finne forholdet mellom leiepris og omsetningspris. I forbindelse med den første problemstillingen er det aktuelt med hypotesetesting. Ved hypotesetesting er den statistiske utfordringen å teste om en får støtte for, eller kan avkrefte, en antakelse om noe, basert på et utvalgt datamateriale. Vi jobber med sett av hypoteser bestående av en nullhypotese, som er den hypotesen vi skal teste, og en
alternativ hypotese. Den alternative hypotesen får støtte dersom nullhypotesen ikke holder (Xxxxx & Xxxxxx, 2012). Selve hypotesetestingen vil bli presentert i kapittel 6. Dette er ikke hovedbestanddelen i vår oppgave, men tas med for å komplementere diskusjonen i kapittel 8. For den andre problemstillingen vil vi teste hypotesen ved hjelp av diskusjon og tolkning av forholdstallene vi utarbeider i kapittel 7. Det blir altså ikke foretatt noen standard hypotesetesting for å støtte opp under, eller avkrefte, denne hypotesen.
Nedenfor presenterer vi hypoteser knyttet til de to problemstillingene i oppgaven. For den første problemstillingen vil vi presentere et sett av hypoteser for eiermarkedet, og et for leiemarkedet, da vi har to ulike avhengige variabler og datasett. For den andre problemstillingen presenterer vi en hypotese som omhandler forholdet mellom leiepris og totalpris. I hypotesene er totalpris oppgitt som den avhengige variabelen i eiermarkedet, og ikke omsetningspris. Grunnen til dette kommer vi tilbake til i kapittel 4.
3.6.1 Hypoteser knyttet til eiermarkedet
H1: Primærromstørrelse har positiv effekt på totalpris
Det er en rimelig antagelse at prisen på en bolig vil øke med økende størrelse på boligen. Variabelen primærromstørrelse har også, ifølge Kain og Xxxxxxx (1970), vist seg å være vesentlig når det kommer til prisen på en bolig. Vi antar dermed at husholdninger vil være villige til å betale mer for større plass, og at primærromstørrelsen til leiligheten dermed vil ha en positiv påvirkning på totalprisen.
H2: Beliggenhet i bydelene som grenser til sentrum gir høyere totalpris enn beliggenhet i de bydelene som ikke grenser til sentrum
I henhold til lokaliseringsteorien til Xxxxxx, Xxxx og Xxxxx beskrevet i 3.3, antar vi at leilighetens plassering i forhold til forretningsdistriktet vil ha en påvirkning på prisen. Ofte er dette forretningsdistriktet lokalisert i sentrum av en by. I henhold til statistikk fra Statistisk Sentralbyrå illustrert i figur 2.4, er det ikke urimelig å anta at de fleste av bydelene som ligger nærme og vest for sentrum vil kunne ha de høyeste prisene også for vårt datasett for eiermarkedet.
H3: Alder har negativ effekt på totalpris
Det er i utgangspunktet rimelig å anta at nyere boliger har bedre standard enn gamle boliger. Dermed kan en anta at husholdninger er villige til å betale mer for nyere
boliger, og mindre for eldre boliger, som fører til at totalprisen synker med økende alder. I tillegg er risikoen ved kjøp av en gammel bolig større enn ved kjøp av en ny bolig når det kommer til vedlikehold, reparasjoner og lignende. Med tiden kan en likevel tenke seg at en stor andel eldre leiligheter i betydelig grad vil bli pusset opp, og dermed oppnå bedre standard. Dette kan redusere effekten av alder på boligprisene, men vi antar likevel at økende alder har en negativ påvirkning på totalprisen.
3.6.2 Hypoteser knyttet til leiemarkedet
H4: Primærromstørrelse har positiv effekt på månedsleie
Tilsvarende som for eiermarkedet, antar vi at økende primærromstørrelse øker betalingsvilligheten til en leietaker, da størrelsen på en leilighet også i tilfellet med utleie antas å være et viktig attributt ved leiligheten.
H5: Antall soverom har positiv effekt på månedsleie
Det er også rimelig å anta at økende antall soverom i en leilighet vil øke prisen og betalingsviljen til en leietaker. Antall soverom som finnes i en leilighet er blant annet en indikator på hvor mange personer som kan bo i leiligheten. Det er dermed rimelig at utleier kan sette et høyere nivå på månedsleien dersom det er plass til flere personer i leiligheten. Når det gjelder leiemarkedet, legger mange utleiere også ut leilighet for utleie rettet mot at den skal benyttes som bokollektiv. Ved økende antall soverom er det flere som kan dele månedsleien mellom seg, og utleier kan dermed rettferdiggjøre hvorfor han totalt sett kan sette en høyere månedlig leiepris.
H6: Beliggenhet i bydelene som grenser til sentrum gir høyere månedsleie enn beliggenhet i de bydelene som ikke grenser til sentrum
Også her kan vi referere til Xxxxxx-Xxxx-Mills-modellen og variasjonen i
pris i forhold til forretningsdistriktet i sentrum. Statistikk fra Statistisk Sentralbyrå illustrert i figur 2.5, viser også at de fleste av bydelene som ligger nærme og vest for sentrum hadde de høyeste leieprisene. Dette underbygger en antakelse om at dette kan være tilfellet også i vårt datasett for leiemarkedet.
H7: Møblering har positiv effekt på månedsleie
Det vil være logisk at jo mer inkludert i leieprisen, desto høyere månedsleie
vil utleier kunne ta. Dersom full møblering er inkludert i månedsleien, vil utleier
“spare” leietaker for kostnader og tid ved å skulle kjøpe egne møbler. Når en leier leilighet er det ofte en midlertidig løsning og man ser ikke for seg å leie i det lange løp. Dersom man har ambisjoner om å leie på permanent basis, er det enten fordi man er kredittrasjonerte og ikke har muligheten til å kjøpe, eller ikke er villige til å ta på seg risikoen ved å kjøpe egen bolig. Vår antakelse er dermed at økt grad av møblering inkludert i månedsleien har en positiv påvirkning på månedsleien.
H8: TV-abonnement, internett og strøm inkludert i månedsleien har positiv effekt på månedsleie
Av samme grunn som for H7, er det ikke urimelig å anta at økende antall goder inkludert i månedsleien, vil rettferdiggjøre at utleier kan sette en høyere månedsleie. Ved at TV-abonnement, internett og/eller strøm er inkludert i månedsleien, vil utleier “spare” leietaker for tid ved å ordne disse godene selv, og de slipper å ha flere separate månedlige innbetalinger. Dermed antar vi at månedsleien vil bli positivt påvirket av at TV-abonnement, internett og/eller strøm er inkludert i månedsleien.
3.6.3 Hypoteser knyttet til forholdstallene
H9: Det er et fast forhold mellom leiepris og totalpris
For vår hovedproblemstilling vil utgangspunktet være en hypotese om at forholdet mellom leiepris og totalpris i Oslo er fast. I tråd med 4-kvadrant-modellen til DiPasquale og Wheaton bør forholdet være fast dersom Oslo anses som ett marked. Det vil si at det ikke finnes ulike delmarkeder i byen.
Dersom vi ikke finner noe tydelig fast forhold mellom leiepris og totalpris i vår analyse, selv om det etter teorien burde være det, ønsker vi å undersøke om forholdstallene basert på vår data varierer med hensyn på to utvalgte faktorer.
Vi ønsker å undersøke om forholdstallene for våre datasett varierer med størrelse på primærrom og med beliggenhet, målt etter hvilken bydel leilighetene ligger i. Dette er basert på studien gjennomført av Bracke (2015) beskrevet tidligere, der han fant at omsetningspris- til-leiepris-rate var høyere for større boliger og for boliger lokalisert i dyrere områder.
Overførbart til leiepris-til-omsetningspris-rate, som er det vi vil benytte, vil dette tilsvare at forholdstallene er mindre for større boliger, og for boliger lokalisert i dyrere områder. Dermed har vi en antakelse om at dette kan være tilfellet også for vår data. I tillegg er
primærromstørrelse og beliggenhet de variablene som er felles i datasettene for eiermarkedet og leiemarkedet. Derfor er det kun disse faktorene vi kan undersøke påvirkningen av.
Dersom vi finner at det ikke er et fast forhold mellom leiepris og totalpris, ønsker vi videre å benytte forholdstallene våre som en mulig lønnsomhetsindikator. Dette er basert på artikler av Xxxx Xxxxx (2014) og Xxxxx Xxxxxx (2010) for magasinet Forbes. Disse sier begge at lave leiepris-omsetningspris-rater betyr at det kan være mer gunstig å leie enn å kjøpe bolig i et område, mens høye forholdstall tilsier at det kan være mer gunstig å kjøpe bolig i et område. Lave forholdstall vil si at det er relativt høy omsetningspris i forhold til leiepris, og omvendt for høye forholdstall. Xxxxx og Xxxxxx introduserer begge et vippepunkt for forholdstallene, som gir grunnlag for å vurdere hva som vil være mest lønnsomt. Dette diskuterer vi nærmere i kapittel 7.
4. Økonometrisk modell
Vi vil benytte oss av regresjon som en av metodene i vår analyse for å estimere henholdsvis månedsleie og omsetningspris. I kapittel 3 presenterte vi kort den generelle hedonistiske prisfunksjonen og forklarte at markedsprisen på en eiendom er satt sammen av prisen for de ulike egenskapene og attributtene eiendommen har. Denne funksjonen ser slik ut:
(4.1) 𝑃 = 𝑓(𝑧1, 𝑧2, … , 𝑧𝑛) → 𝑃(𝑍)
Vi ønsker å undersøke denne empirisk, ved å estimere hvordan ulike faktorer påvirker henholdsvis omsetningspris og månedsleie. Det finnes svært mange ulike varianter av den generelle hedonistiske prisfunksjonen man kan benytte seg av. De følgende funksjonsformene brukes ofte i analyser av eiendomspriser, og vi avgrenser oss dermed til å benytte disse tre variantene i vår analyse:
(4.2) 𝑃(𝑍) = 𝑎0 + 𝑎1𝑍1 + 𝑎2𝑍2+. . . +𝑎𝑛𝑍𝑛 + 𝜀
(4.3) 𝑃(𝑍) = 𝑒𝑏0+𝑏1Z1+𝑏2Z2+⋯+𝑏𝑛Z𝑛+𝑒
(4.4) 𝑃(𝑍) = 𝑐 𝑍 𝑐1 𝑍
𝑐2 … 𝑒(Z𝑛𝑐𝑛+𝗌)
0 1 2
I funksjon 4.4 er den siste variabelen, Zn, oppgitt som en såkalt dummyvariabel, og har dermed verdier på 0 eller 1. En ser at funksjon 4.2 er lineær, men det er derimot ikke funksjon
4.3 og 4.4. For at alle funksjonene skal kunne benyttes i en statistisk regresjonsanalyse må de være lineære i sine parametere. Da må vi benytte den naturlige logaritmen til 4.3 og 4.4, ved å sette ln på begge sider av likhetstegnet i begge funksjonene. Dette resulterer i følgende tre funksjoner, som vi vil benytte i analysen av vår data:
(4.2) 𝑃(𝑍) = 𝑎0 + 𝑎1𝑍1 + 𝑎2𝑍2 + ⋯ + 𝑎𝑛𝑍𝑛 + 𝜀 Lineær funksjonsform
(4.5) 𝑙𝑛𝑃(𝑍) = 𝑏0 + 𝑏1𝑍1 + 𝑏2𝑍2 + ⋯ + 𝑏𝑛𝑍𝑛 + 𝜀 Semilogaritmisk funksjonsform (4.6) 𝑙𝑛𝑃(𝑍) = 𝑙𝑛𝑐0 + 𝑐1𝑙𝑛𝑍1 + 𝑐2𝑙𝑛𝑍2 + ⋯ + 𝑐𝑛𝑍𝑛 + 𝜀 Dobbeltlogaritmisk funksjonsform
Etter å ha benyttet den naturlige logaritmen i 4.5 og 4.6 har vi fått alle tre funksjonene uttrykt på den felles generelle formen:
(4.7) 𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑛𝑋𝑛 + 𝜀, der Y=P eller lnP og X=Z eller lnZ
4.1 Transaksjonsmodellen og Leieprismodellen
Da vi opererer med data fra både eiermarkedet for leiligheter og leiemarkedet for leiligheter, og dermed skal benytte to ulike datasett i vår analyse, vil vi definere en regresjonsmodell for eiermarkedet og en for leiemarkedet. Disse definerer vi slik:
Transaksjonsmodellen:
(4.8) 𝑇𝑜𝑡𝑎𝑙𝑝𝑟𝑖𝑠 = 𝑇l𝑃𝐸𝑖𝑒 = 𝑓(𝑍), der Z=vektor for attributter ved eierboligene Leieprismodellen:
(4.9) 𝑀å𝑛𝑒𝑑𝑠𝑙𝑒𝑖𝑒 = 𝑃p𝐿𝑒𝑖𝑒 = 𝑔(𝑊), der W=vektor for attributter ved leieboligene
Totalpris - Omsetningspris og behandling av fellesgjeld
Ser en på funksjonen i Transaksjonsmodellen er Totalpris oppgitt som den avhengige variabelen. I utgangspunktet benyttet vi omsetningspris alene som den avhengige variabelen for eiermarkedet. Videre i oppgaven tar vi hensyn til fellesgjeld, og inkluderer denne som en del av omsetningsprisen, selv om den egentlig er en utsatt betaling. Vi har med bakgrunn x Xxxxxxxx og Xxxxxxx (2016) valgt å lage en ny avhengig variabel for eiermarkedet som vi kaller Totalpris. Vi uttrykker denne slik:
(4.10) 𝑇𝑜𝑡𝑎𝑙𝑝𝑟𝑖𝑠 = 𝑂𝑚𝑠𝑒𝑡𝑛𝑖𝑛𝑔𝑠𝑝𝑟𝑖𝑠 + 𝛾𝐹𝑒𝑙𝑙𝑒𝑠𝑔𝑗𝑒𝑙𝑑
Vi ønsker senere å estimere 𝛾-verdien gjennom regresjon i STATA, men benytter i første omgang 𝛾=0,87, i tråd med resultatene til Xxxxxxxx og Xxxxxxx (2016).
4.2 Utdypelse om regresjonsfunksjonene
Videre vil vi gi en utdypende forklaring av regresjonsfunksjonene vi skal benytte. I tillegg vil vi vise en grafisk fremstilling av regresjonsmodeller, og presentere forutsetningene for regresjon. For vår analyse av de avhengige variablene totalpris og månedsleie, er det viktig at vi tar hensyn til forutsetningene, for å få en regresjonsfunksjon med koeffisienter som best
mulig forklarer de avhengige variablene våre hver for seg. Teorien presentert i dette kapitlet er i sin helhet basert på Stock & Xxxxxx (2012).
4.2.1 Lineær multivariat regresjon
Den lineære regresjonsfunksjonen vi skal benytte inkluderer flere uavhengige variabler. Da kalles metoden multippel eller multivariat regresjonsanalyse. Ettersom salgsprisen eller leieprisen på en bolig sjeldent kan forklares kun av forholdet mellom to variabler, er det multippel regresjonsanalyse vi skal benytte i vår analyse. Her vil man kunne inkludere de uavhengige variablene som antas å påvirke den avhengige variabelen mest. Ved multippel regresjon vil den generelle regresjonsligningen se slik ut:
(4.11) 𝑃 = 𝛽0 + 𝛽1𝑍1 + 𝛽2𝑍2 + ⋯ + 𝛽𝑛𝑍𝑛 + 𝜀
Denne tilsvarer funksjon 4.2, vist tidligere. I funksjonen representer 𝛽0 konstantleddet, som gjenspeiler verdien av den avhengige variabelen (P) dersom verdien av de uavhengige variablene (Zn) er lik 0. 𝛽n er de estimerte koeffisientene til hver av de uavhengige variablene, og representerer hvor mye P vil endre seg dersom Zn endres med én enhet. Hensikten er å se
hvorvidt, og i hvilken grad, vi har en statistisk signifikant sammenheng mellom én avhengig og flere uavhengige variabler.
I tillegg til at de uavhengige variablene kan forklare variasjonen i P, er det også rimelig å se for seg at det er flere forhold enn disse som kan være med å påvirke. Alle disse øvrige forholdene, og den tilfeldige variasjonen i P, samler man i en uobservert variabel som man kaller for et restledd. Restleddet betegner man ofte som det greske symbolet ε. Dette vil gjelde for alle regresjonsmodeller.
Vi ønsker med multippel regresjon å finne de “rene” effektene av de uavhengige variablene og sammenligne styrken av disse effektene. Følgelig ønsker vi å finne 𝛽-verdiene i funksjonen. Med denne modellen antar en at sammenhengen mellom den avhengige og de
uavhengige variablene er lineær. Dette er ikke tilfelle i virkeligheten i sammenhengen mellom boligpris og boligens attributter.
4.2.2 Multivariat logaritmisk regresjon
Når en ikke har en lineær sammenheng i forholdet mellom avhengig og uavhengig variabel, forsøker man å finne transformasjoner av de opprinnelige variablene, som gjør at relasjonen en finner blir lineær i de transformerte variablene. Sagt på en annen måte ønsker man å få dem lineære i sine parametere. Vi ønsker å benytte oss av en logaritmisk omkoding av variablene. Her benytter en seg av den naturlige logaritmen til P eller Z, eller både P og Z. Logaritmisk regresjon konverterer endringene i variablene til prosentvise endringer. Vi introduserer her den eksponentielle funksjonen til Z, eZ, i tillegg til den naturlige logaritmen, der e er en konstant som representerer et tall tilnærmet 2,71828. Den naturlige logaritmen
uttrykkes som funksjonen 𝑍 = ln (𝑒Z). Logaritmer kan brukes ved tre ulike tilfeller i
regresjonsanalyser. I denne oppgaven benyttes to av disse; semilogaritmisk funksjonsform og dobbeltlogaritmisk funksjonsform, som nevnt tidligere.
Semilogaritmisk regresjon
Ved å ta den naturlige logaritmen av den avhengige variabelen P i funksjon 4.3, og holde de uavhengige variablene uendret, slik det er gjort i funksjon 4.5, har vi det vi kaller semilogaritmisk eller log-lineær modell. Denne funksjonen vil vise den prosentvise endringen i den avhengige variabelen P når vi endrer de Zn uavhengige variabler med én enhet.
Endringen vises gjennom 𝛽-verdiene, også kalt koeffisientene, for hver uavhengig variabel.
𝛽-verdiene multiplisert med 100 er den prosentvise endringen i P som følge av endringen i Zn.
Dobbeltlogaritmisk regresjon
Ved å ta den naturlige logaritmen av både P og Z-ene i funksjon 4.4, som er gjort i 4.6, har vi en dobbeltlogaritmisk eller log-log modell. Her har vi at dersom den prosentvise endringen i Zn er 1%, så er 𝛽n den prosentvise endringen i P knyttet til endringen i Zn. Altså kan 𝛽n tolkes
som elastisiteten til P med hensyn på Zn. For dummyvariabler vil det være noe annerledes.
Dersom en dummyvariabel inntreffer, kan tilhørende koeffisient tolkes som prosentvis endring i pris.
4.2.3 Forenklet grafisk fremstilling av regresjonsmodeller
Regresjonsmodeller kan også illustreres grafisk med en forenklet modell. Vi har i utgangspunktet den felles generelle funksjonsformen nevnt tidligere:
(4.7) 𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑛𝑋𝑛 + 𝜀 der Y=P eller lnP og X=Z eller lnZ
For enkelt å kunne presentere en grafisk modell for regresjon, benytter vi en situasjon med kun én uavhengig variabel som antas å påvirke den avhengige variabelen:
(4.12) 𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝜀
En grafisk fremstilling av funksjon 4.12 kan se slik ut:
Figur 4.1: Regresjonsmodell med avhengig variabel og en uavhengig variabel
Figur 4.1 viser sammenhengen mellom avhengig variabel, Pris, og én attributt ved boligen som uavhengig variabel, X1. Sammenhengen illustreres ved den estimerte tilpassede rette linjen. Dette er regresjonslinjen, som representerer funksjonen som brukes i regresjonen. Denne kan være stigende eller fallende avhengig av hva slags sammenheng det er mellom variablene. Metoden som benyttes for å estimere regresjonslinjen kalles minste kvadraters metode. En tar utgangspunkt i en tilfeldig valgt linje som trekkes mellom observasjonene i analysen. Deretter beregnes residualene, som i figuren er definert som e1, e2 og e3. Disse representerer avvik fra den enkelte observasjon til linjen. Etter å ha funnet residualene, kvadreres disse, og en finner summen av alle de kvadrerte residualene. Metoden brukes for å finne den linjen som gir minst mulig samlet kvadratisk avvik, eller varians, til alle observasjonene.
I tillegg kan en inkludere en eller flere dummyvariabler for å undersøke om endringer i den avhengige variabelen kan forklares av fraværet, eller tilstedeværelsen, av den eller de aktuelle
dummyvariablene. En dummyvariabel lages gjerne med utgangspunkt i kategoriske variabler, der de ulike kategoriene i variabelen tildeles verdier på 1 og 0. Dermed har en laget en numerisk variabel som kan benyttes i en statistisk analyse, til fordel for den kategoriske fremstillingen av variabelen. Effekten av å inkludere én dummyvariabel i en regresjonsanalyse med avhengig variabel og én uavhengig variabel kan illustreres grafisk slik:
Figur 4.2: Regresjonsmodell med avhengig variabel, en uavhengig variabel og en dummyvariabel
Figur 4.2 viser hvordan en dummyvariabel, d1, vil kunne påvirke regresjonslinjen. Dummyvariabelen vil kun ha den effekten at den hever eller senker linjen parallelt. I dette tilfellet hever den linjen, slik at prisen øker ved ulike verdier av X1, sammenliknet med en modell uten dummyvariabel. Dette er dog en meget forenklet fremstilling av regresjonsmodeller og effekten av å inkludere en dummyvariabel.
4.2.4 Forutsetninger for regresjonsanalyse
For å få ut korrekte 𝛽-verdier fra enhver regresjonsanalyse må følgende forutsetninger ligge til grunn:
1. Linearitet. I modellen er Y en lineær funksjon av alle de ulike X-ene og restleddet ε. Man sier ofte at modellen er lineær i sine parametre.
2. Ukorrelert restledd. Restleddet til en av observasjonene i analysen skal ikke korrelere med restleddet til en annen av observasjonene.
3. Homoskedastisitet. Variasjonen til restleddet bør være konstant for alle verdier av X. Om det ikke foreligger homoskedastisitet får man fortsatt korrekte estimater for koeffisientene, men testene som gjennomføres vil ikke være helt brukbare.
4. Fravær av multikolinearitet. Ingen av de uavhengige variablene må korrelere sterkt med hverandre. Om de uavhengige variablene skulle henge sterkt sammen, vil ikke regresjonsanalysen klare å regne seg frem til korrekte koeffisientestimater for disse variablene, og man vil ikke klart kunne si i hvilken grad hver av de uavhengige variablene påvirker den avhengige. Dette er spesielt viktig når en jobber med multippel regresjon og har flere uavhengige variabler.
5. Restleddet (ε) er ukorrelert med X-ene i analysen.
6. Normalfordelt restledd
Disse forutsetningene bør altså ligge til grunn for alle de tre regresjonsmodellene vi skal benytte videre i analysen.
4.3 Hypotesetesting
I kapittel 6 skal vi foreta hypotesetester av de hypotesene i oppgaven som er knyttet til den første problemstillingen. Videre beskriver vi hvordan en standard hypotesetest gjennomføres.
Når en skal teste en hypotese presenteres den som et hypotesesett bestående av en nullhypotese, H0, og en alternativhypotese, HA. De alternative hypotesene i denne oppgaven vil være de som ble presentert i kapittel 3, og nullhypotesene vil være deres rake motsetninger. Alternativhypotesene kan være enten ensidige eller tosidige. En ensidig test undersøker om det finnes en sammenheng mellom de aktuelle variablene, og om det er en bestemt retning på sammenhengen. En tosidig test undersøker om det er sammenheng mellom to ulike variabler, men ikke hvilken retning sammenhengen har. Det er nullhypotesen som testes, og vi undersøker om den kan avkreftes eller ikke ut ifra vår analyse. Dersom nullhypotesen kan avkreftes, får vi støtte for alternativhypotesen. Sett fra et vitenskapelig perspektiv kan vi ikke med sikkerhet bekrefte at det vi finner er riktig, men vi kan i beste fall få avkreftet det som er feil.
Når en tester hypotesene ønsker en å sjekke om de er statistisk signifikante. Da benytter man resultatene man får ut fra en regresjonsanalyse. For å fastslå om resultatene er signifikante, ser en på t-verdier eller p-verdier, som er signifikansindikatorer i regresjonsanalysen. Dersom koeffisienten til variabelen er signifikant, får vi støtte for at den uavhengige variabelen påvirker den avhengige variabelen på den måten som er oppført i alternativhypotesen. For å kunne vurdere om koeffisientene er signifikante, må vi sette et konfidensintervall og et
signifikansnivå. Vi vil benytte oss av et konfidensintervall på 95 % og et signifikansnivå på 5
%. Et signifikansnivå på 5 % betyr at det er en 5 % sannsynlighet for å forkaste nullhypotesen når den i realiteten er sann. Ved dette nivået kan en forkaste nullhypotesen dersom p-verdien er mindre enn 0,05. Ved bruk av t-verdier er den kritiske verdien forskjellig for ensidig og tosidig test ved et konfidensintervall på 95 % og signifikansnivå på 5 %. For ensidige tester kan nullhypotesen forkastes dersom den absolutte t-verdien er større enn 1,645, mens for tosidige tester kan den forkastes dersom absoluttverdien av t er større enn 1,96. Alle våre hypotesetester er ensidige tester, og vi vil benytte p-verdier som mål på signifikans.
5. Datainnsamling og beskrivelse av datamaterialet
Dette kapitlet tar først for seg hva slags data som er benyttet i analysen, hvordan og hvorfra data har blitt samlet inn og rensing av de to datasettene som er benyttet. Videre følger en beskrivelse av hvordan vi har definert og kodet variabler i STATA, og en deskriptiv fremstilling av datamaterialet med tabeller og histogrammer.
5.1 Innsamlingsmetode og datarensing
I denne oppgaven har vi, som tidligere nevnt, valgt å se på forholdet mellom prisen ved å leie og å kjøpe bolig i Oslo by. For å undersøke dette forholdet begrenset vi utvalget vårt til leiligheter. Vi vil gjennomføre en kvantitativ analyse av forholdet mellom leiepris og xxxxxxxxx.Xx har benyttet to ulike populasjoner og hentet sekundærdata fra to ulike databaser. Datasettene vi benytter består av:
1. Eierboliger - I markedet for eierboliger har vi benyttet data for leiligheter etter skatteetatens definisjon som en boenhet i en bygning med minst to etasjer, tre boenheter og felles inngang (Skatteetaten, 2018).
2. Leieboliger - For leiemarkedet tok vi for oss data for leiligheter uavhengig av om de ligger i blokk eller i bolig med utleieenhet.
All data som er hentet inn er solgte leiligheter og leiligheter til utleie innenfor Oslos bygrense, definert ved bydelsgrensene, som vist i figur 5.1 nedenfor (Oslo Kommune, 20182).
Figur 5.1: Kart over Oslo inndelt i bydeler
Nedenfor følger en beskrivelse av metode for datainnsamling og datarensing, først for eierboliger deretter for leieboliger.
5.1.1 Eierboliger
For eiermarkedet i har vi hentet inn data fra xxxxxxxxxxxxx.xx. Dette er en database som inneholder svært mye informasjon om det norske boligmarkedet. For å få den informasjonen vi trengte, har vi skilt ut solgte boliger i Oslo i perioden fra og med 1. januar 2018, til og med
28. februar 2018. Videre har vi valgt boligtype leiligheter, med eierform selveie og borettslag/andelslag. Vi har hentet inn data fra omsetningsrapportene i databasen for hver bydel i Oslo, i tillegg til sentrum, og alle observasjoner som var tilgjengelige ble hentet ut. Dette viste seg å være 2658 observasjoner. Vi valgte å stryke marka fra datasettet grunnet manglende boligomsetninger. Omsetningsrapportene inneholder data for flere ulike attributter og informasjon knyttet til boligene. Vi har primært ønsket å hente ut informasjon om
omsetningspris, primærromstørrelse, beliggenhet, fellesgjeld, eierform og byggeår. Alle observasjonene ble samlet og renset i et eget datasett i Excel.
Selv om Eiendomsverdi har mye informasjon om eiendomsmarkedet, er det ikke fullstendig informasjon om alle faktorene i omsetningsrapportene for alle observasjonene vi har samlet inn. Dermed var det nødvendig å gjennomføre noe datarensing, for å fjerne feil og få et mest mulig korrekt datasett for analysen. Mangler i datasettet, og ufullstendig informasjon, kan ha ulike virkninger på en videre analyse og påvirke resultatene, som er ønskelig å unngå. Derfor studerte vi alle faktorene i datasettet for å avdekke eventuelle observasjoner som burde fjernes.
Variabelen primærromstørrelse har vist seg å være sentral når det kommer til prisen på en bolig (Kain and Xxxxxxx, 1970). Variabelen er også sentral i vår analyse, og dermed så vi det nødvendig å fjerne de observasjonene som manglet informasjon om denne variabelen. Disse utgjorde 109 av de 2658 observasjonene. Observasjonene som manglet primærromstørrelse hadde heller ikke informasjon om bruttoareal, og vi hadde dermed ikke mulighet til å finne primærromstørrelse som en funksjon av bruttoareal. Videre har vi fjernet de observasjonene der det ikke var oppgitt byggeår i Excel, da vi også skal benytte denne variabelen i analysen. Her fjernet vi ni observasjoner. Vi avdekket også to observasjoner som hadde oppgitt svært lav omsetningspris på henholdsvis 400 000 kr og 514 581 kr. Etter å ha sett på størrelsen på leilighetene, her henholdsvis 71 m2 og 121 m2, prisantydningen, beliggenheten, størrelsen på fellesgjeld og byggeår, valgte vi å fjerne disse fra datasettet. Vi endte etter dette med 2538 observasjoner i datasettet for eierleiligheter, før vi lastet det opp i programmet STATA for videre koding og analyse.
Tabell 5.1: Frafallsoversikt eierdata
Opprinnelig antall observasjoner | 2658 |
Observasjoner fjernet grunnet manglende p-rom | 109 |
Observasjoner fjernet grunnet manglende byggeår | 9 |
Observasjoner fjernet grunnet usannsynlige verdier av pris | 2 |
Observasjoner benyttet videre i analysen | 2538 |
I tillegg til primærromstørrelse og byggeår, oppdaget vi mangler vedrørende omsetningspris og enkelte andre variabler. Behandlingen av disse kommer vi tilbake til under delkapitlet om koding.
5.1.2 Leieboliger
For leieboligene hentet vi ut data manuelt fra Xxxx.xx sine offentlige annonser, lagt ut av både privatpersoner og profesjonelle aktører, som Forenom og Fredensborg. Her har vi også delt Oslo inn i bydelene og sentrum, og utelatt marka grunnet manglende annonser. Vi skilte ut boligtypen leiligheter, og utelot dermed rom i bofellesskap og hybel. Vi valgte videre de leilighetene som var tilgjengelige for leie fra og med januar og februar 2018. Dette fordi annonsene på Xxxx.xx legges ut og forsvinner relativt hurtig, og ved å hente inn for januar og februar ville vi kunne få et mest mulig riktig bilde av leieprisene i markedet her og nå. Data ble samlet inn i perioden 16. januar til 22. januar. Dermed må det tas forbehold om at flere annonser fra januar har blitt fjernet, og at noen som ville ha hatt utleiedato fra februar ikke enda er registrert på siden. Noen observasjoner har også utleiedato fra før 16. januar og har dermed enda ikke blitt leid ut, som for eksempel kan indikere at leiligheten anses som lite attraktiv eller har en pris som er høyere enn etterspørselen. Leiligheter som anses som mer attraktive og har priser som møter etterspørselen, kan bli utleid raskere, og dermed hurtigere bli fjernet fra nettsiden. På tross av dette antar vi at utvalget av utleieboliger vil være tilstrekkelig og representativt for markedet i Oslo. Vi har primært ønsket å hente ut data for variablene månedsleie, primærromstørrelse, antall soverom, beliggenhet og hvorvidt det er Tv, internett og/eller strøm inkludert i leieprisen. I tillegg har vi hatt lyst til å undersøke om tilgang til bod, balkong og heis har kunnet påvirke leieprisen.
Vi hentet i første omgang ut 25% av utleieannonsene ved å samle inn informasjon fra hver fjerde annonse i hver bydel. Dette gjorde vi for å begrense omfanget av datainnsamlingen, da all informasjon fra Xxxx.xx måtte hentes manuelt. Innsamlingen resulterte i første omgang i 322 observasjoner. Siden vi har hentet inn datamateriale fra privatpersoner og enkeltstående bedrifter må det tas forbehold om menneskelige feil, og at informasjonen i annonsene ikke er 100% pålitelige. Blant annet kan det forekomme at noen leiligheter har blitt lagt ut under feil bydel, særlig for boliger som ligger ved en bydelsgrense. I tillegg var en del rom i bofellesskap lagt ut under leiligheter. Disse hoppet vi over under innsamlingen, slik at boligtypen for alle observasjoner ble leiligheter som leies ut i sin helhet. Vi la også merke til at det var få utleieleiligheter i bydelene lengst fra sentrum og midt i sentrum, som gir en noe
skjev fordeling i datamaterialet med tanke på at disse kan være underrepresentert. Årsaken til dette kan være at det er svært mange bygninger som brukes til kontor i sentrum og at det er et større antall eneboliger i utkantområdene av Oslo.
Også i datasettet for leieboliger har vi til en viss grad sett det nødvendig å utføre datarensing. Annonsene har ulik mengde informasjon, som gjorde det vanskelig å få tilstrekkelig informasjon om alle variablene vi ønsket å bruke i analysen. Spesielt ble det ved gjentatte tilfeller beskrevet lite om hva som er inkludert i leieprisen med hensyn til tv, internett, strøm, varmtvann og oppvarming. I tillegg manglet enkelte observasjoner postnummer eller adresse, antall soverom og månedsleie. I flere tilfeller har vi brukt sunn fornuft med tanke på noen av manglene. For eksempel har vi forutsatt at dersom det ikke er oppgitt at det finnes tilhørende heis, bod eller balkong i informasjonsteksten, listen over fasiliteter, bildene eller plantegningene, så har ikke leiligheten tilgang til disse fasilitetene. Dette fordi det er sannsynlig at utleier vil presisere tilstedeværelsen av disse, da det trolig gjør en leilighet mer attraktiv for potensielle leietakere. Grunnet denne betydelige mengden manglende informasjon, så vi oss nødt til å fjerne en andel av observasjonene. Vi valgte dermed å skille ut 5% av observasjonene i hver bydel, for at vi videre skulle ha like stor andel observasjoner fra hver bydel. I hver bydel fjernet vi det antallet hele observasjoner som tilsvarte 5 %, ved å benytte standard avrunding. Vi fjernet bevisst de observasjoner som tilsynelatende hadde mest ufullstendig informasjon med hensyn til de attributtene vi var ute etter. Vi fjernet 16 observasjoner totalt, og endte opp med et datasett for utleieleilighetene på 306 observasjoner. Alle observasjonene for leiemarkedet ble samlet og renset i et eget dokument i Excel.
Tabell 5.2: Frafallsoversikt leiedata
Opprinnelig antall observasjoner 25% | 322 |
Observasjoner fjernet grunnet mangler 5% | 16 |
Observasjoner benyttet videre i analysen 20% | 306 |
Til slutt hadde vi to datasett med til sammen 2844 observasjoner som skulle brukes videre i analysen i STATA.
5.2 Definisjon og operasjonalisering av variabler
Under følger en beskrivelse av alle variablene vi har benyttet i analysen. For utvalgte variabler, forklarer vi i tillegg hvordan vi har definert dem og funnet dem. De øvrige variablene i datasettene har vi valgt ikke å benytte i denne analysen, grunnet manglende opplysninger og relevans.
5.2.1 Avhengige variabler
Totalpris
Vi vil benytte totalpris som den avhengige variabelen i den delen av vår analyse som omfatter eiermarkedet. Totalpris består av omsetningspris og fellesgjeld, som definert i kapittel 4.
Omsetningsprisen er den prisen i kroner som leiligheten er solgt for. Vi henter omsetningspris og fellesgjeld direkte ut fra Eiendomsverdi.
Månedsleie
Leieprisen er månedlig leiesum i kroner for leie av en leilighet i datasettet, hentet manuelt ut fra Xxxx.xx. Månedsleie er den avhengige variabelen i den delen av vår analyse som omfatter leiemarkedet.
Det gjøres først analyser av begge de avhengige variablene hver for seg. Videre foretar vi en kartlegging av forholdet mellom leieprisen og totalprisen.
5.2.2 Uavhengige variabler
Analysen i avhandlingen inkluderer en rekke uavhengige variabler som kan ha innvirkning på henholdsvis omsetningsprisen og leieprisen. Det er disse variablene vi ønsker å undersøke effekten av. Da vi analyserer to avhengige variabler i to ulike datasett med forskjellig informasjon om attributter og egenskaper tilknyttet leilighetene, vil analysene inkludere både like og ulike variabler i de to markedene. I datasettene har vi en del uavhengige variabler som er kategoriske variabler. For at disse skal kunne benyttes i den statistiske analysen må disse omkodes til dummyvariabler med kategorier av 0 og 1 i STATA.
Felles variabler for eier- og leiemarkedet:
Primærromstørrelse
Størrelsen på en leilighet har vist seg å være en faktor som spiller en vesentlig rolle når man skal skaffe seg bolig, enten man skal kjøpe eller leie bolig. Dermed kan variabelen antas å ha en virkning på både omsetningsprisen og leieprisen. Etter datarensingen i Excel har vi data for primærromstørrelse for alle observasjoner i begge datasettene brukt i analysen. Størrelsen er oppgitt i antall kvadratmeter, og er dermed numeriske verdier i datasettet.
Beliggenhet
Vi vet at boligprisene i Oslo historisk sett varierer mellom bydelene. Dermed vil beliggenhet også kunne påvirke prisene i denne analysen. I våre datasett kan beliggenhet undersøkes ut ifra både adresse, postnummer og bydel. Disse beliggenhetsindikatorene har vi informasjon om i begge datasettene. Vi valgte å bruke bydeler som beliggenhetsindikator. Dette fordi vi inkluderer leiligheter som leies ut og er solgt i hele Oslo. Vi valgte å ikke benytte postnummer da det er svært få observasjoner knyttet til hvert postnummer. Dette kunne gjort analysen noe uoversiktlig og gjort det vanskeligere å studere resultatene. I tillegg kunne vi enkelt hente ut data for både eiermarkedet og leiemarkedet ut ifra hvilken bydel leilighetene ligger i, og antar videre at bydelene i Oslo er en god indikator på ulike plasseringer i byen.
Bydelene er kategoriske variabler i datasettet.
Uavhengige variabler knyttet til eiermarkedet:
Alder
Alder er en variabel som særlig kan tenkes å påvirke et boligkjøp, da alderen på en leilighet kan si noe om standarden og andre avgjørende forhold. Vi har konvertert data for byggeår til variabelen alder i STATA. For eierleilighetene hentet vi data om byggeår rett ut fra omsetningsrapportene på Eiendomsverdi. Etter omkodingen er variabelen oppgitt som alder i hele tall, og er en numerisk variabel. Alder på boligen er ikke så stort problem for leietaker, ettersom leietaker kan velge å flytte derfra dersom det skulle vise seg at boligen ikke står til forventningene. Dette er dermed et større problem for en som skal kjøpe leilighet.
Fellesgjeld
Fellesgjeld er en variabel som finnes i datasettet for eiermarkedet. Flere av leilighetene, særlig de med eierform borettslag, har oppgitt en kroneverdi for fellesgjeld. Dette er dermed en numerisk variabel. Der fellesgjeld ikke er oppgitt har vi antatt fellesgjelden er lik 0.
Eierform
Data for eiermarkedet skiller i utgangspunktet mellom eierformene borettslag og selveier. Prisene kan variere mellom eierformene, delvis fordi fellesgjelden i borettslag kan redusere omsetningsprisen. I vårt datasett fant vi flere tilfeller der leiligheter som var oppgitt med eierform selveier, også hadde oppgitt fellesgjeld. Vi delte dermed variabelen opp i tre kategorier; selveier, borettslag og selveier med fellesgjeld. Denne variabelen er en kategorisk variabel i datasettet.
Uavhengige variabler knyttet til leiemarkedet:
Antall soverom
Antallet soverom som finnes i en leilighet er også et sentralt attributt ved boligen, og kan påvirke både omsetningspris og leiepris. Et par trenger kanskje ikke mer enn ett soverom, mens en familie eller venner kan ha behov for flere. Etter datarensing i Excel har vi numerisk data for antall soverom for alle utleieenhetene. Det hadde vært hensiktsmessig å ha data for antall soverom for omsetningene i eiermarkedet i tillegg, men denne variabelen fantes ikke i omsetningsrapporten på Eiendomsverdi. Dermed er denne variabelen kun inkludert i analysen for leiemarkedet.
Etasje
Vi antar at etasjen leiligheten ligger i til en viss grad kan påvirke prisen. Det oppfattes blant annet gjerne som mindre attraktivt å bo i første etasje, grunnet innsyn og enklere tilgang med tanke på innbrudd. Dersom leiligheten ligger høyt oppe i bygningen, kan dette sees på som mindre attraktivt, forutsatt at det ikke er heis i bygningen. Data om etasje har vi også her hentet inn kun for leiemarkedet, da det var manglende informasjon om variabelen i omsetningsrapportene fra Eiendomsverdi.
Møblering, TV-abonnement, internett og strøm
Om møbler, TV-abonnement, internett eller strøm er inkludert i månedsleien kan ha innvirkning på leieprisen. Dersom alt er inkludert, vil leieprisen trolig være høyere enn dersom ingen av godene er inkludert. Kategoriene for møblering er møblert, delvis møblert og ikke møblert. Vi observerte at utleierne har en noe forskjellig tolkning av begrepet delvis møblert, så disse leilighetene har ikke nødvendigvis helt likt nivå av møblering. De øvrige variablene har kategorier på ja og nei, avhengig av om de er inkludert i månedsleien eller ikke. Alle fire variablene er kategoriske variabler.
Balkong, bod og heis
Vi ønsker å undersøke hvilken effekt tilgang til balkong, bod og heis har på leieprisen. Det er naturlig å tenke at tilgang til disse attributtene kan ha en positiv effekt på prisen. For eksempel kan variabelen heis henge sammen med etasje. En kan tenke seg at dersom leiligheten ligger høyt opp i bygningen, vil tilgang til heis kunne påvirke prisen. Disse variablene er kategoriske. Også her hadde det vært hensiktsmessig med data om disse variablene for eiermarkedet, men det fantes ikke i omsetningsrapportene.
5.2.3 Variabeloversikt
Under følger en oversikt over de ulike variablene vi har benyttet i analysen for henholdsvis eiermarkedet og leiemarkedet, sortert etter type variabel.
Tabell 5.3: Variabeloversikt
Type variabel | Eiermarkedet | Leiemarkedet |
Avhengig: | Totalpris i hele kr | Månedsleie i hele kr |
Uavhengig: | Primærromstørrelse i m2 | Primærromstørrelse i m2 |
Bydel | Bydel | |
Alder i hele tall | ||
Eierform | ||
Etasje i hele tall | ||
Antall soverom i hele tall | ||
Møblering |
TV-abonnement | ||
Internett | ||
Strøm | ||
Balkong | ||
Bod | ||
Heis |
5.4 Koding av datamateriale
Etter at datasettene var renset og operasjonaliseringsprosessen var ferdig, var det nødvendig å omkode en del av variablene slik at de enklere kunne benyttes i analysen. Dette ble gjort i programmet STATA.
Vi har kodet om noen av de numeriske variablene i datasettet. Pris og fellesgjeld blir som nevnt omkodet til en totalpris, slik at fellesgjeld inkluderes på venstresiden i regresjonen, som del av den avhengige variabelen. Vi har nevnt tidligere at vi vil benytte oss av en 𝛾-verdi på
0,87 i samsvar med Xxxxxxx og Xxxxxxx (2016), som vil si at vi vi legger til 87% av
fellesgjelden til omsetningsprisen. Vi vil senere gjennomføre regresjonsanalyse for flere 𝛾-
xxxxxxx for å se om modellens forklaringskraft endrer seg. Byggeår har vi omkodet til alder, da dette vil være enklere å håndtere i analysen. I tillegg er variabelen pris omkodet til å være lik den tilhørende prisantydningen der pris ikke er oppgitt i datasettet. Dette gjør vi fordi en betydelig andel av prisene på leiligheter i bydel Grorud ikke var oppgitt i Eiendomsverdi sine omsetningsrapporter. Det er essensielt at alle observasjoner har oppgitt pris, og at prisen er korrekt beløp. Etter å ha gjennomført datarensingen ovenfor, fant vi 57 observasjoner som manglet omsetningspris. Av disse var 51 observasjoner i bydel Grorud. Dette utgjorde 37% av de totale observasjonene for Grorud. Da dette er en betydelig andel av leilighetene i datasettet for bydelen, kunne de manglende prisene ha påvirket analysen.
Datasettene har også en rekke kategoriske variabler som vi ønsket å inkludere, og som dermed måtte kodes om til numeriske variabler. Dette gjøres ved å omgjøre variablene til dummyvariabler i STATA. Her omkodes kategoriene i hver enkelt variabel til tallverdier på 1 og 0. I regresjonsanalysen utelates en av dummyvariablene knyttet til hver variabel, slik at en unngår multikollinearitet. Den utelatte dummyvariabelen fungerer som en referansevariabel.
Dette betyr at regresjonskoeffisientene en får ut for hver dummyvariabel viser variasjonen i avhengig variabel i forhold til den utelatte dummyvariabelen.
Nedenfor følger en oversikt over variabelnavnene benyttet i STATA og kodingen av variablene, først for eiermarkedet og deretter for leiemarkedet. Variablene med en D i slutten av variabelnavnet er kategoriske variabler som har blitt omkodet til dummyvariabler.
Tabell 5.4: Variabelnavn og koding av variabler i datasettet for eiermarkedet
Variabelnavn | Koding |
Totalpris | I hele kroner Totalpris=Pris + γFellesgjeld |
P-rom (primæromstørrelse) | I kvadratmeter |
Alder | I hele tall Alder=2018-Byggeår |
XxxxX XxxxxxX … OstensjoD | Alna=1, resten=0 Bjerke=1, resten=0 … Østensjø=1, resten=0 Dummy for Frogner utelates |
BorettslagD | Borettslag=1, resten=0 |
SelveierFD | Selveier med fellesgjeld=1, resten=0 Dummy for selveier uten fellesgjeld utelates |
Tabell 5.5: Koding av variabler i datasettet for leiemarkedet
Variabelnavn | Koding |
Mnedsleie (månedsleie) | I hele kroner |
Primrromm2 (primærromstørrelse) | I kvadratmeter |
Antallsoverom | I hele tall |
Etasje | I hele tall |
Møblering | Ikke møblert=1 Delvis møblert=2 Møblert=3 |
XxxxX XxxxxxX … OstensjoD | Alna=1, resten=0 Bjerke=1, resten=0 … Østensjø=1, resten=0 Dummy for sentrum utelates |
TVD (TV-abonnement inkludert) | Ja=1, Nei=0 |
NettD (internett inkludert) | Ja=1, Nei=0 |
StrmD (strøm inkludert) | Ja=1, Nei=0 |
BalkD (balkong) | Ja=1, Nei=0 |
HeisD | Ja=1, Nei=0 |
BodD | Ja=1, Nei=0 |
5.3 Presentasjon av datamateriale
I dette delkapitlet presenteres innsamlet data ved hjelp av deskriptiv statistikk. Deskriptiv statistikk, eller beskrivende statistikk, har som formål å presentere data eller observasjoner på en hensiktsmessig og begripelig måte. Da vi benytter en stor mengde data, vil vi illustrere dem ved å benytte tabeller og histogrammer, for å gjøre det enkelt og oversiktlig å tolke dem. Vi tar først for oss data for eiermarkedet og deretter data for leiemarkedet.
5.3.1 Deskriptiv statistikk for eiermarkedet
Vi presenterer her en tabell med oversikt over våre data for eiermarkedet.
Tabell 5.6: Deskriptiv statistikk for eiermarkedet, N=2538
Variabel | Gj.snitt | St.avvik | Min | Max |
Totalpris | 4226484 | 1896418 | 1192572 | 23000000 |
Pris | 4082847 | 1942443 | 584572 | 23000000 |
Fellesgjeld | 143636.8 | 251401.7 | 0 | 3249385 |
Prom | 65.28369 | 24.76731 | 15 | 258 |
Alder | 60.59039 | 36.78949 | 0.1 | 168 |
BorettslagD | .5563436 | .4969132 | 0 | 1 |
SelveierFD | .2427108 | .4288061 | 0 | 1 |
SelveierD | .2009456 | .4007864 | 0 | 1 |
AlnaD | .0732861 | .2606568 | 0 | 1 |
BjerkeD | .0500394 | .2180692 | 0 | 1 |
FrognerD | .1099291 | .312863 | 0 | 1 |
GamleOD | .1000788 | .3001642 | 0 | 1 |
GrorudD | .0555556 | .2291066 | 0 | 1 |
GrunerD | .1386919 | .3456928 | 0 | 1 |
NordreAD | .0394011 | .1945856 | 0 | 1 |
NordstrandD | .0500394 | .2180692 | 0 | 1 |
SageneD | .1193853 | .3243053 | 0 | 1 |
SentrumD | .0019701 | .0443503 | 0 | 1 |
StHanshD | .0693459 | .2540916 | 0 | 1 |
StovnerD | .0260047 | .1591806 | 0 | 1 |
SondreND | .0248227 | .1556151 | 0 | 1 |
UllernD | .0283688 | .1660568 | 0 | 1 |
VestreAD | .0299448 | .1704688 | 0 | 1 |
OstensjoD | .0831363 | .2761426 | 0 | 1 |
Tabellen ovenfor viser gjennomsnittsverdier, standardavvik og minimums- og maksimumsverdier. Gjennomsnittet beregnes ved å summere alle verdiene til en variabel og dividere på antall observasjoner til denne variabelen. Standardavviket viser med hvor mye en rekke med verdier viker fra rekkens gjennomsnitt. Om standardavviket viser seg å være høyt, vil dette svare til en betydelig spredning fra gjennomsnittet (Stock & Watson, 2012).
Det kan være hensiktsmessig å kommentere noen av variablene ytterligere. Verdiene i tabellen over kan i tillegg illustreres i et histogram for de ulike variablene. Vi vil vise histogrammer for variablene omsetningspris, fellesgjeld, totalpris, primærromstørrelse og alder, og beskrive noen av dummyvariablene nærmere.
Omsetningspris
Omsetningsprisen på bolig er en del av den avhengige variabelen totalpris, i den delen av analysen som knyttes til eiermarkedet. Histogrammet nedenfor viser hvordan denne varierer i våre data. Gjennomsnittet vi kan lese fra tabellen ovenfor viser at snittprisen for leilighet i Oslo er 4 082 842 kr. Fra histogrammet ser vi at det er klart flere leiligheter som ligger nærmere minimumsprisen på 584 572 enn maksimumsprisen på 23 000 000, som forklarer hvorfor snittprisen trekkes nedover.
Figur 5.2: Histogram for omsetningspris
Fellesgjeld
Fellesgjeld er den andre delen i avhengig variabel. Fellesgjelden strekker seg fra 0 kr til
3 249 385 kr. Vi ser fra histogrammet nedenfor at det er svært mange observasjoner som har 0 i fellesgjeld. Grunner til dette kan være at vi har både borettslagsleiligheter og selveierleiligheter med i datasettet. Selveierleilighetene har lite eller ingen fellesgjeld. Også noen av borettslagsleilighetene kan ha 0 i fellesgjeld dersom gjelden har blitt betalt ned, og jo eldre boligen er jo lavere vil ofte fellesgjelden være. Det er svært stort sprik mellom minimum og maksimumsverdiene, dog er det så få observasjoner med ekstremt høy fellesgjeld at de ikke bidrar til å trekke snittet på 143 636,8 kr betydelig opp.
Figur 5.3: Histogram for fellesgjeld
Totalpris
Histogrammet nedenfor viser den avhengige variabelen totalpris, som består av omsetningspris og fellesgjeld. Fordelingen er ikke veldig ulik den for omsetningspris. Vi leser fra tabell 5.6 at snittprisen ligger på 4 226 484 kr, og fra histogrammet under ser vi at det er i dette prisområdet, eller lavere, de fleste leilighetene ligger.
Figur 5.4: Histogram for totalpris
Primærrom
Vi vet fra tidligere at boligmarkedet for leiligheter i stor grad består av mindre leiligheter. Våre data bekrefter også dette, med en snittstørrelse på 65,29 m2. Spredningen er stor, med en maksimumsstørrelse på 258 m2 og minimumsstørrelsen kun 15 m2. Datamaterialet for denne variabelen avviker lite fra normalfordelingen, vist ved den grønne kurven i figuren.
Figur 5.5: Histogram for primærrom
Alder
Vi ser fra tabell 5.6 at den eldste og yngste boligen i vårt datasett er henholdsvis 168 år og 0,1 år. En alder på 0,1 år gjenspeiler de leilighetene som er bygd og solgt i inneværende år 2018. Fra figuren nedenfor ser vi at det er relativt jevn spredning i alder på leilighetene i vårt datasett, med en snittalder på omtrent 61 år. Grunnen til at snittalderen er såpass høy kan ha noe å gjøre med at det er en stor mengde eldre boligblokker i Oslo og lite rom for nybygging.
Figur 5.6: Histogram for alder
Bydel
Gjennomsnittstallene for dummyvariablene for bydelene viser hvor stor andel av observasjonene som ligger i hver enkelt bydel. Fra tabell 5.6 ser vi at det er flest leiligheter solgt i bydelene Grünerløkka, Sagene, Frogner og Gamle Oslo, fordelt på henholdsvis 13,9%
12%, 11% og 10%. Dermed står disse bydelene for omtrent 47% av totale leiligheter solgt. De bydelene der det er solgt færrest leiligheter er sentrum og Xxxxxx Xxxxxxxxxx med henholdsvis 0,2% og 2,5% av totalt boligsalg.
Eierform
I datasettet jobber vi med tre eierformer, borettslag, selveier med fellesgjeld og selveier uten fellesgjeld. Fra tabellen ser vi at leiligheter i borettslag står for over halvparten av våre observasjoner, med 55,6% av boligene, selveier uten fellesgjeld står for 20%, og selveier med fellesgjeld står for de resterende 24,4%. Vi ser fra Statistisk Sentralbyrå og folke- og boligtellingen i 2011 at det ble talt opp 217 729 borettslagsleiligheter og 135 923 leiligheter som var selveier alene eller selveier gjennom sameie. Dermed ser vi også her at borettslagsleiligheter er størst representert, og at selveier med fellesgjeld i vårt datasett sannsynligvis i realiteten er selveierleiligheter gjennom sameie.
5.3.2 Deskriptiv statistikk for leiemarkedet
Vi presenterer her en tabell med oversikt over våre data for leiemarkedet.
Tabell 5.7: Deskriptiv statistikk for leiemarkedet, N=306
Variabel | Gj.snitt | St.avvik | Min | Max |
Mnedsleie | 14825.72 | 4377.264 | 7900 | 40000 |
Primrromm2 | 55.44771 | 21.53668 | 15 | 186 |
Antallsoverom | 1.477124 | .8614511 | 0 | 4 |
Etasje | 2.702614 | 1.753627 | 0 | 9 |
MobD | .2418301 | .4288933 | 0 | 1 |
DelMobD | .1764706 | .3818445 | 0 | 1 |
IMobD | .5816993 | .4940881 | 0 | 1 |
TVD | .5718954 | .4956145 | 0 | 1 |
ITVD | .4281046 | .4956145 | 0 | 1 |
NettD | .5555556 | .4977179 | 0 | 1 |
INettD | .4444444 | .4977179 | 0 | 1 |
StrmD | .2189542 | .4142149 | 0 | 1 |
IStrmD | .7810458 | .4142149 | 0 | 1 |
BalkD | .6143791 | .4875389 | 0 | 1 |
IBalkD | .3856209 | .4875389 | 0 | 1 |
HeisD | .3823529 | .4867581 | 0 | 1 |
IHeisD | .6176471 | .4867581 | 0 | 1 |
BodD | .4705882 | .4999518 | 0 | 1 |
IBodD | .5294118 | .4999518 | 0 | 1 |
AlnaD | .0196078 | .1388755 | 0 | 1 |
BjerkeD | .0522876 | .222971 | 0 | 1 |
FrognerD | .2156863 | .4119713 | 0 | 1 |
GamleOD | .0718954 | .2587378 | 0 | 1 |
GrorudD | .0098039 | .0986896 | 0 | 1 |
GrunerD | .1764706 | .3818445 | 0 | 1 |
NordreAD | .0294118 | .1692345 | 0 | 1 |
NordstrandD | .0359477 | .1864647 | 0 | 1 |
SageneD | .0751634 | .2640867 | 0 | 1 |
SentrumD | .0457516 | .2092882 | 0 | 1 |
StHanshD | .1111111 | .3147845 | 0 | 1 |
StovnerD | .0228758 | .1497525 | 0 | 1 |
SondreND | .0228758 | .1497525 | 0 | 1 |
UllernD | .0490196 | .2162626 | 0 | 1 |
VestreAD | .0392157 | .1944257 | 0 | 1 |
OstensjoD | .0228758 | .1497525 | 0 | 1 |
Tabellen ovenfor viser gjennomsnittsverdier, standardavvik og minimums- og maksimumsverdier for data samlet inn for leiemarkedet. Nedenfor følger en mer utfyllende beskrivelse av variablene månedsleie, primærromstørrelse, antall soverom og etasje, med histogrammer for hver variabel, og en beskrivelse av verdiene i tabellen for noen av dummyvariablene.
Månedsleie
Månedsleie er vår avhengige variabel for leiemarkedet, og figuren under viser variasjonen i månedsleie i datasettet. Vi ser ut fra tabell 5.7 at månedsleien varierer mellom 7 900 og 40 000 kroner. Fra histogrammet ser vi at mesteparten av leilighetene har en leiepris som er nærmere minimumsverdien enn maksimumsverdien. Dermed vil gjennomsnittsverdien, som er 14 825,72, ligge nærmere 7 900 enn 40 000.
Figur 5.7: Histogram for månedsleie
Primærrom
Størrelsen på primærrom varierer mellom 15 og 186 m2 i datasettet. En ser fra histogrammet under at den største delen av leilighetene har en størrelse omkring gjennomsnittet på 55,45 m2, og kun få leiligheter er over 100 m2.
Figur 5.8: Histogram for primærrom
Antall soverom
Datasettet inkluderer leiligheter som har 0 soverom, det vil si ettromsleiligheter, og leiligheter med opptil 4 soverom. Av histogrammet under ser en tydelig at flest leiligheter har 1 soverom, og gjennomsnittet på 1,48 ligger dermed marginalt nærmere 1 enn 2 soverom.
Figur 5.9: Histogram for antall soverom
Etasje
Leilighetene ligger i etasjer som varierer fra underetasje (0) til 9. etasje. En ser fra histogrammet under at mesteparten av observasjonene ligger i 1., 2. eller 3. etasje, men at
leilighetene i etasjene over dette trekker gjennomsnittet opp til 2,7.
Figur 5.10: Histogram for etasje
Bydel
Fra tabell 5.7 ser en at de største andelene av leilighetene som leies ut er plassert i Frogner, Grünerløkka og St. Hanshaugen, med gjennomsnitt på henholdsvis 21,6%, 17,65% og 11,11%. Til sammen utgjør disse leilighetene hele 50,36% av alle observasjonene i datasettet. Bydelene Alna og Grorud har færrest andel av leilighetene, med gjennomsnitt på henholdsvis 1,96% og 0,98%.
Møblering og tilgang til balkong, heis og bod
Leilighetene i datasettet er i utleieannonsene oppgitt som møblert, delvis møblert, og ikke møblert. Vi ser av tabellen at gjennomsnittsverdien for umøblerte leiligheter er størst, med en verdi på 0,5817. Godt over halvparten har balkong, og rett under halvparten har bod tilknyttet leiligheten. En noe mindre andel på 38% har heis i bygningen.
TV inkludert, internett inkludert og strøm inkludert
Vi ser fra tallene i tabellen at rundt halvparten av leilighetene har TV-abonnement og internett inkludert i leien, mens en betydelig mindre andel har strøm inkludert i leien.
5.3.3 Korrelasjon
Vi ønsker å finne ut hvor mye av variasjonen i omsetningspris og leiepris som kan forklares av de uavhengige variablene, og korrelasjonskoeffisientene kan fortelle oss noe om dette. Vi kan definere korrelasjon som et mål på samvariasjonen mellom to variabler, og
korrelasjonskoeffisienten måler styrken på den lineære sammenhengen mellom variablene. Koeffisienten ligger mellom -1 og 1. Jo nærmere absoluttverdien er 1, desto sterkere er sammenhengen mellom de to variablene. Man sier at variablene er perfekt positivt korrelert med hverandre dersom verdien er 1 og perfekt negativt korrelert dersom verdien er -1. Om noen av variablene skulle vise seg å være perfekt korrelerte med hverandre har vi det som kalles multikollinearitet. I kapittel 4 om økonometrisk modell ble det nevnt at å unngå multikolinearitet er viktig når man estimerer multivariate regresjonsfunksjoner. Grunnen til at vi vil unngå dette er at det vil være vanskelig å skille ut hvilken variabel som påvirker den avhengige variabelen ved perfekt korrelasjon. Løsningen på multikollinearitet kan være å samle inn mer data, da det i noen tilfeller er datasettet det er problemer med og ikke nødvendigvis modellen. En annen løsning kan være å fjerne en av variablene som korrelerer sterkt med hverandre fra analysen (Xxxxx & Xxxxxx, 2012). Vi ønsker å ha en sterk korrelasjon mellom den avhengige og de uavhengige variabelene vår. Vi ønsker derimot i minst mulig grad å ha sterk korrelasjon mellom de uavhengige variablene.
Videre tar vi først for oss korrelasjonsmatrisen for eiermarkedet, og deretter for leiemarkedet. Vi har valgt å utelate bydelene i begge korrelasjonsmatrisene, da det generelt ikke var noen av disse korrelasjonskoeffisientene som var nevneverdig høye.
Tabell 5.8: Korrelasjonsmatrise for eiermarkedet
Totalpris | Pris | Fellesgjeld | Prom | Alder | BorettslagD | SelveierD | SelveierFD | |
Totalpris | 1.0000 | |||||||
Pris | 0.9919 | 1.0000 | ||||||
Fellesgjeld | -0.1203 | -0.2456 | 1.0000 | |||||
Prom | 0.7726 | 0.7610 | -0.0511 | 1.0000 | ||||
Alder | -0.0151 | -0.0116 | -0.0248 | -0.0882 | 1.0000 | |||
BorettslagD | -0.3745 | -0.4129 | 0.3686 | -0.1898 | 0.1120 | 1.0000 | ||
SelveierD | 0.2668 | 0.2973 | -0.2866 | 0.1098 | -0.2687 | -0.5616 | 1.0000 | |
SelveierFD | 0.1846 | 0.2007 | -0.1593 | 0.1173 | 0.1214 | -0.6340 | -0.2839 | 1.0000 |
Vi har inkludert både omsetningspris og totalpris i matrisen og ser at disse naturlig nok korrelerer sterkt positivt, med en verdi på 0,9919. Som forventet, korrelerer størrelse på primærrom sterkt positivt med totalpris, med en verdi på 0,7726. Dette viser at jo større
leilighet man ønsker å kjøpe, jo dyrere blir den. Eierform borettslag korrelerer negativt med selveier og selveier med fellesgjeld, med henholdsvis -0,5616 og -0,634. Dette er naturlig siden boligen kun kan være knyttet til en eierform av gangen. Om det skulle være en borettslagsleilighet er det naturlig nok ikke en selveierleilighet. I tillegg ser vi en positiv korrelasjon mellom borettslag og fellesgjeld på 0,3686, som også er naturlig da de fleste borettslag har fellesgjeld. Det er også verdt å nevne at det er en svak korrelasjon mellom fellesgjeld og alder på -0,0248. Dette kan ha noe å gjøre med at det i nyere borettslag ofte er mer fellesgjeld enn i gamle borettslag, ettersom fellesgjelden betales ned over tid. Overordnet sett vil det ikke være fare for multikollinearitet mellom de uavhengige variablene i dette datasettet.
Tabell 5.9: Korrelasjonsmatrise for leiemarkedet
Mnedsleie | Primrromm2 | Antall soverom | Etasje | MobD | DelMobD | IMobD | TVD | |
Mnedsleie | 1.0000 | |||||||
Primrromm2 | 0.6541 | 1.0000 | ||||||
Antallsoverom | 0.6477 | 0.7823 | 1.0000 | |||||
Etasje | 0.1870 | -0.0161 | 0.0139 | 1.0000 | ||||
MobD | 0.2722 | -0.0788 | -0.1092 | 0.1788 | 1.0000 | |||
DelMobD | -0.1333 | -0.0360 | -0.0076 | -0.1270 | -0.2614 | 1.0000 | ||
IMobD | -0.1333 | 0.0962 | 0.1007 | -0.0570 | -0.6660 | -0.5459 | 1.0000 | |
TVD | 0.1193 | -0.1522 | -0.1036 | 0.0681 | 0.1647 | -0.0153 | -0.1312 | 1.0000 |
ITVD | -0.1193 | 0.1522 | 0.1036 | -0.0681 | -0.1647 | 0.0153 | 0.1312 | -1.0000 |
NettD | 0.1024 | -0.1762 | -0.1079 | 0.0697 | 0.1826 | 0.0173 | -0.1718 | 0.7015 |
INettD | -0.1024 | 0.1762 | 0.1079 | -0.0697 | -0.1826 | -0.0173 | 0.1718 | -0.7015 |
StrmD | 0.1500 | -0.2179 | -0.2110 | 0.0087 | 0.4023 | 0.0866 | -0.4161 | 0.2345 |
IStrmD | -0.1500 | 0.2179 | 0.2110 | -0.0087 | -0.4023 | -0.0866 | 0.4161 | -0.2345 |
BalkD | 0.1059 | 0.1798 | 0.0882 | 0.1684 | -0.1014 | 0.0673 | 0.0359 | 0.0880 |
IBalkD | -0.1059 | -0.1798 | -0.0882 | -0.1684 | 0.1014 | -0.0673 | -0.0359 | -0.0880 |
HeisD | 0.2052 | -0.0498 | -0.1081 | 0.4140 | 0.1681 | -0.1878 | -0.0008 | 0.1507 |
IHeisD | -0.2052 | 0.0498 | 0.1081 | -0.4140 | -0.1681 | 0.1878 | 0.0008 | -0.1507 |
BodD | -0.0522 | 0.1287 | 0.0403 | 0.0480 | -0.1655 | -0.1273 | 0.2420 | 0.0483 |
IBodD | 0.0522 | -0.1287 | -0.0403 | -0.0480 | 0.1655 | 0.1273 | -0.2420 | -0.0483 |
ITVD | NettD | INettD | StrmD | IStrmD | BalkD | IBalkD | HeisD | |
ITVD | 1.0000 | |||||||
NettD | -0.7015 | 1.0000 | ||||||
INettD | 0.7015 | -1.0000 | 1.0000 | |||||
StrmD | -0.2345 | 0.2668 | -0.2668 | 1.0000 | ||||
IStrmD | 0.2345 | -0.2668 | 0.2668 | -1.0000 | 1.0000 | |||
BalkD | -0.0880 | 0.0210 | -0.0210 | -0.1325 | 0.1325 | 1.0000 | ||
IBalkD | 0.0880 | -0.0210 | 0.0210 | 0.1325 | -0.1325 | -1.0000 | 1.0000 | |
HeisD | -0.1507 | 0.1759 | -0.1759 | 0.1363 | -0.1363 | 0.2227 | -0.2227 | 1.0000 |
IHeisD | 0.1507 | -0.1759 | 0.1759 | -0.1363 | 0.1363 | -0.2227 | 0.2227 | -1.0000 |
BodD | -0.0483 | -0.0395 | 0.0395 | -0.2934 | 0.2934 | 0.1013 | -0.1013 | 0.0262 |
IBodD | 0.0483 | 0.0395 | -0.0395 | 0.2934 | -0.2934 | -0.1013 | 0.1013 | -0.0262 |
IHeisD | BodD | IBodD | |
IHeisD | 1.0000 | ||
BodD | -0.0262 | 1.0000 | |
IBodD | 0.0262 | -1.0000 | 1.0000 |
Fra tabell 5.9 ser en at primærromstørrelse korrelerer positivt med månedsleie, med en korrelasjonskoeffisient på 0,6541. Grunnen til at den er lavere enn for eierboligene kan være at vi for leieboligene har med antall soverom som en variabel, og denne fanger opp noe av det samme. Denne korrelasjonen er forventet, da det er sannsynlig at leieprisen vil være høyere ved økende størrelse på leiligheten. Forventet er det også at antall soverom har sterk positiv korrelasjon med prisen, siden flere rom kan tenkes å øke leieprisen. Den sterkeste korrelasjonen i matrisen er den positive korrelasjonen mellom primærromstørrelse og antall soverom på 0,7823. Dette er også en forventet sammenheng, siden det er plass til flere soverom jo større leiligheten er. Sterk positiv korrelasjon finner en i tillegg mellom internett inkludert i leieprisen og TV-abonnement inkludert i leieprisen på 0,7, som kan indikere at dersom internett er inkludert er gjerne TV-abonnement også inkludert. I tillegg ser vi at
dummyvariabelen for umøblert leilighet korrelerer negativt med møblert og delvis møblert leilighet, med koeffisienter på henholdsvis -0,666 og -0,5459. Dette vil være naturlig, ettersom en leilighet kun kan ha en grad av møblering om gangen.
Videre har vi en positiv korrelasjon på 0,414 mellom tilgang til heis og etasje. Dersom leiligheten ligger høyt opp i bygningen, vil det naturligvis være mer attraktivt om bygningen har heis. Mellom strøm inkludert i leieprisen, og møblert og umøblert leilighet, finner vi også en litt under middels sterk korrelasjon, på henholdsvis 0,4023 og -0,4161. Dette kan indikere at fullt møblerte leiligheter også inkluderer strøm i leieprisen, og at umøblerte leiligheter ikke har strøm inkludert i leieprisen. Overordnet sett vil det heller ikke være fare for multikollinearitet mellom de uavhengige variablene i datasettet for leiemarkedet.
6. Estimering av regresjonsfunksjoner og testing av hypoteser
I kapittel 4, økonometrisk modell, presenterte vi regresjonsfunksjonene vi skal estimere i dette kapitlet. Vi estimerer først foreløpige modeller for eiermarkedet og for leiemarkedet, ved å benytte en 𝛾-verdi=0,87 når vi håndterer fellesgjelden i eiermarkedet. Resultatene fra de
estimerte modellene presenteres i sammenstilte tabeller. Deretter bestemmer vi funksjonsform
for videre analyse, basert på den regresjonsmodellen som best møter de generelle forutsetningene for regresjon. Videre vil vi undersøke om det er andre 𝛾-verdier enn 0,87 som vil gi en bedre estimert modell for eiermarkedet. Til slutt vil vi re-estimere de endelige
funksjonsformene for eier- og leiemarkedet. De re-estimerte funksjonene vil vi benytte for å teste våre hypoteser og estimere forholdstall. Når vi velger modell er det blant annet viktig å undersøke om modellen møter de generelle forutsetningene for regresjon.
Vi estimerer regresjonsfunksjoner i programmet STATA. Forklaringskraften for en regresjonsmodell finner vi ved R2. R2 forteller oss hvor godt våre data passer til den estimerte regresjonslinjen. Verdien av R2 varierer mellom 0 og 1, der en verdi på 1 i teorien betyr at de uavhengige variablene forklarer 100 % av variasjonen i den avhengige variabelen. Ofte er det ikke slik at modellen gir en forklaringskraft på 100 %, som vil si at de resterende prosentene forklares av restleddet og variabler som ikke er inkludert i analysen. I tillegg får vi ut justert R2, som kan gi en indikasjon på om man skal inkludere eller utelate en variabel fra analysen. Dersom justert R2 skulle vise seg å bli høyere når man inkluderer variabelen, bør man ha den med i analysen. Blir den derimot lavere bør man utelate variabelen. Regresjonskoeffisientene viser hvor mye hver av de uavhengige variablene påvirker den avhengige variabelen, og om påvirkningen er positiv eller negativ. I tillegg viser regresjonsresultatene om hver av koeffisientene har signifikant påvirkning på avhengig variabel eller ikke. Ved et konfidensintervall på 95 %, som i modellene vi har presentert, vil koeffisientene være signifikant forskjellig fra 0 dersom p-verdien er lavere enn signifikansnivået på 0,05. Dersom koeffisientene er signifikante kan en forkaste en eventuell nullhypotese tilknyttet variabelen.
For å undersøke fravær av multikollinearitet benytter man en VIF-test i STATA. I følge Tjønndal (2018) kan det foreligge multikollinearitet dersom VIF-scoren er høyere enn 10. Vi ønsket i første omgang å utelate dummyvariabelen for sentrum i regresjonen for begge markedene, i tråd med lokaliseringsteorien. Ved å utelate sentrum fra regresjonen for eiermarkedet fikk vi svært høye VIF-verdier. Dermed forelå det fare for multikollinearitet,
som kan gi uriktige estimerte koeffisienter i regresjonen. Vi har testet ved å utelate andre bydeler, og fant ved å utelate bydel Frogner at vi fikk lave VIF-verdier og signifikante koeffisienter for de øvrige bydelsdummyene. Vi fant også at Frogner hadde det høyeste prisnivået i eiermarkedet. For leiemarkedet var det uproblematisk å utelate dummy for sentrum, og vi fant at det var denne bydelen som hadde høyest prisnivå. Med dette utelater vi de bydelene som viser seg å ha høyest prisnivå i både eiermarkedet og leiemarkedet.
I tabell 6.1 og 6.2 nedenfor presenterer vi resultatene fra de tre regresjonsmodellene vi har estimert, først for eiermarkedet og deretter for leiemarkedet. I rutene tilknyttet variablene har vi presentert regresjonskoeffisienten og plassert p-verdien i parentes under tilhørende regresjonskoeffisient. Helt i bunnen av tabellene finner man R2, justert R2, maksimum VIF- verdi og gjennomsnittlig VIF-verdi.
6.1 Lineær, semilogaritmisk og dobbeltlogaritmisk regresjonsfunksjon for eiermarkedet
Under følger de estimerte regresjonsfunksjonene for eiermarkedet. Vi presenterer variablene med tilhørende koeffisienter og p-verdier for hver enkelt funksjonsform.
Tabell 6.1 Regresjonsmodeller eiermarkedet, p-verdi i parentes, N=2538
Variabel | Lineær | Semilog | Dobbeltlog |
Prom | 59314.85 (0.0000) | .0111 (0.0000) | .7254 (0.0000) |
Alder | -3026.2692 (0.0000) | -.0008 (0.0000) | -.0346 (0.0000) |
BorettslagD | -385527.37 (0.0000) | -.0749 (0.0000) | -.0648 (0.0000) |
SelveierFD | -281050.3 (0.0000) | -.0423 (0.0000) | -.0376 (0.0000) |
AlnaD | -2465844.7 (0.0000) | -.5055 (0.0000) | -.5529 (0.0000) |
BjerkeD | -1928247.8 (0.0000) | -.3435 (0.0000) | -.4116 (0.0000) |
GamleOD | -1166350.2 (0.0000) | -.1944 (0.0000) | -.2536 (0.0000) |
GrorudD | -2514260.9 (0.0000) | -.5452 (0.0000) | -.5919 (0.0000) |
GrunerD | -853960.51 (0.0000) | -.1264 (0.0000) | -.1798 (0.0000) |
NordreAD | -543997.59 (0.0000) | -.0981 (0.0000) | -.1167 (0.0000) |
NordstrandD | -1655823.5 (0.0000) | -.3064 (0.0000) | -.3552 (0.0000) |
SageneD | -740526.76 (0.0000) | -.1032 (0.0000) | -.1442 (0.0000) |
SentrumD | -1130948 (0.0020) | -.1878 (0.0031) | -.1655 (0.0094) |
StHanshD | -533867.9 (0.0000) | -.0524 (0.0000) | -.0858 (0.0000) |
StovnerD | -3151841.3 (0.0000) | -.6455 (0.0000) | -.6818 (0.0000) |
SondreND | -3146726.4 (0.0000) | -.6346 (0.0000) | -.6798 (0.0000) |
UllernD | -767140.17 (0.0000) | -.1558 (0.0000) | -.1385 (0.0000) |
VestreAD | -1450538 (0.0000) | -.2335 (0.0000) | -.2504 (0.0000) |
OstensjoD | -2055541.9 (0.0000) | -.3978 (0.0000) | -.4560 (0.0000) |
Konstantledd | 2081737.4 (0.0000) | 14.7874 (0.0000) | 12.6467 (0.0000) |
R2 | .8211 | .8509 | .8500 |
Justert R2 | .8198 | .8497 | .8489 |
VIF maks | 2.28 | 2.28 | 2.53 |
VIF snitt | 1.61 | 1.61 | 1.61 |
Vi ser at alle regresjonsfunksjonene har en R2 som er større enn 0,8. Dette er relativt høyt, som vil si at de uavhengige variablene i modellen godt forklarer variasjonene i den avhengige variabelen. For de tre regresjonsfunksjonene viser koeffisientene tilknyttet samtlige av variablene seg å være signifikant forskjellig fra 0, med en p-verdi som er lavere enn 0,05. At koeffisientene er signifikante viser om estimatet på koeffisientene er presise. Koeffisienten tilhørende variabelen primærrom har den største positive påvirkningen på totalprisen for alle tre funksjonsformene. For den lineære modellen tolker vi koeffisienten for primærromstørrelse slik at en økning i størrelsen på leiligheten med 1 m2 tilsvarer en økning i totalpris på 59 314,85 kr. For den semilogaritmiske modellen tolker vi regresjonskoeffisienten
på den måten at en økning i primærromstørrelse på 1 m2 vil øke totalpris med 1,11 %. For den dobbeltlogaritmiske modellen vil en 1 % økning i primærromstørrelse tilsvare en 0,7254 % økning i totalpris. Koeffisienten tilhørende variabelen alder har negativ påvirkning på totalprisen i alle tre regresjonsmodellene. For den lineære modellen kan vi tolke koeffisienten slik at om en leilighet blir ett år eldre, vil totalprisen for denne boligen reduseres med 3026,26 kr. For den semilogaritmiske modellen, vil en økning i boligens alder med ett år redusere prisen med 0,08 %. For den dobbeltlogaritmiske modellen vil en økning i alder med 1 % redusere totalprisen med 0,0346 %.
Fra resultatene observerer vi også at koeffisientene til eierformene borettslag og selveier med fellesgjeld gir en negativ påvirkning på pris. Ettersom vi har utelatt dummy for selveier uten fellesgjeld, kan vi tolke dette som at leiligheter med eierformene borettslag eller selveier med fellesgjeld vil gi en lavere totalpris enn om man skulle kjøpt leilighet med eierform selveier uten fellesgjeld. I regresjonen har vi utelatt dummy for Frogner. For alle tre regresjonsmodellene kan vi se at koeffisientene til de resterende bydelene er negative.
Ettersom den utelatte dummyen fungerer som en referansevariabel, kan vi tolke dette som at totalprisen man må betale for leilighet er lavere i alle andre bydeler enn i Frogner. De minst negative koeffisientene finner vi i Nordre Aker, Sagene, St. Hanshaugen og Ullern. Disse har dermed et høyere prisnivå enn de resterende bydelene. De mest negative koeffisientene finner vi i bydelene Alna, Grorud, Stovner og Xxxxxx Xxxxxxxxxx. Dette vil si at disse bydelene har et lavere prisnivå enn de resterende bydelene. Det er verdt å nevne at alle disse ligger langt unna sentrum.
Videre ønsker vi å undersøke hvor godt regresjonsmodellene vi har estimert møter de generelle forutsetningene for regresjonsanalyse. Tabell 6.1 viser høyeste og gjennomsnittlig VIF-verdi. For alle tre regresjonsfunksjonene er verdiene lavere enn 10, og det er derfor ingen fare for multikollinearitet. En annen forutsetning er at restleddet bør være homoskedastisk.
Dette innebærer at vi ikke ønsker å se et tydelig mønster i restleddets spredning. Plotdiagrammene nedenfor viser spredningen for henholdsvis lineær, semilogaritmisk og dobbeltlogaritmisk regresjonsmodell for eiermarkedet.
Figur 6.1: Spredning i restledd for eiermarkedet, f.v. lineær, semilog og dobbeltlog
Ut ifra spredningsdiagrammene ovenfor kan vi se en klar vifteform både for lineær regresjonsmodell og dobbeltlogaritmisk regresjonsmodell. Vi kan dermed tolke dette som at restleddet er heteroskedastisk for disse modellene. For den semilogaritmiske regresjonsmodellen er det ikke umiddelbart like klart at det foreligger et tydelig mønster. Vi kan dermed si at homoskedastisk restledd i størst grad er oppfylt for den semilogaritmiske modellen.
I tillegg ønsker vi at restleddet skal være normalfordelt. Sannsynligheten for å underestimere og overestimere en verdi bør være omtrent den samme, altså burde det foreligge symmetri i fordelingen av restledd. Dersom den blå tykke linjen følger den rette linjen perfekt, er restleddet helt normalfordelt.
Figur. 6.2: Restleddsfordeling for eiermarkedet, f.v. lineær, semilog, dobbeltlog
For den lineære modellen ser vi at den tykke linjen avviker noe fra den rette linjen. Vi kan dermed ikke anse restleddet i den lineære modellen som normalfordelt. For semilogaritmisk og dobbeltlogaritmisk regresjonsmodell ser vi at den tykke linjen følger den rette linjen godt, som vil si at den er tilnærmet normalfordelt.
6.2 Lineær, semilogaritmisk og dobbeltlogaritmisk regresjonsfunksjon for leiemarkedet
Under følger de estimerte regresjonsfunksjonene for leiemarkedet. Vi presenterer variablene med tilhørende koeffisienter og p-verdier for hver enkelt funksjonsform.
Tabell 6.2: Estimerte regresjonsmodeller leiemarkedet, p-verdi i parentes, N=306
Variabel | Lineær | Semilog | Dobbeltlog |
Primrromm2 | 93.4437 (0.0000) | .0053 (0.0000) | .5117 (0.0000) |
Antallsoverom | 1794.8772 (0.0000) | .1328 (0.0000) | .0101 (0.0054) |
Etasje | 63.5011 (0.4400) | .0035 (0.4790) | .0130 (0.0004) |
MobD | 1419.6794 (0.0000) | .1018 (0.0000) | .0774 (0.0004) |
DelMobD | -93.4410 (0.7961) | .0063 (0.7705) | .0029 (0.9001) |
TVD | 552.5345 (0.1268) | .0366 (0.0884) | .0358 (0.1205) |
NettD | 314.1834 (0.3838) | .0207 (0.3341) | .0340 (0.1395) |
StrmD | 1826.9537 (0.0000) | .0905 (0.0000) | .1043 (0.0000) |
BalkD | 600.0643 (0.0360) | .0459 (0.0070) | .0156 (0.3870) |
HeisD | 811.5384 (0.0075) | .0527 (0.0034) | .0513 (0.0056) |
BodD | -265.6205 (0.3233) | -.0056 (0.7276) | -.0353 (0.0400) |
AlnaD | -7336.587 (0.0000) | -.3978 (0.0000) | -.3889 (0.0000) |
BjerkeD | -6025.0351 (0.0000) | -.3261 (0.0000) | -.2893 (0.0000) |
FrognerD | -4629.5937 (0.0000) | -.2316 (0.0000) | -.2187 (0.0000) |
GamleOD | -4941.1528 (0.0000) | -.2519 (0.0000) | -.2234 (0.0000) |
GrorudD | -6967.7456 (0.0000) | -.3690 (0.0000) | -.3808 (0.0000) |
GrunerD | -4613.3219 (0.0000) | -.2227 (0.0000) | -.2352 (0.0000) |
NordreAD | -7097.1952 (0.0000) | -.4138 (0.0000) | -.3695 (0.0000) |
NordstrandD | -7502.084 (0.0000) | -.4338 (0.0000) | -.4195 (0.0000) |
SageneD | -5660.626 (0.0000) | -.2998 (0.0000) | -.2884 (0.0000) |
StHanshD | -4700.3729 (0.0000) | -.2355 (0.0000) | -.2155 (0.0000) |
StovnerD | -7827.3677 (0.0000) | -.4334 (0.0000) | -.3830 (0.0000) |
SondreND | -7770.067 (0.0000) | -.4530 (0.0000) | -.5048 (0.0000) |
UllernD | -6839.3894 (0.0000) | -.3933 (0.0000) | -.3184 (0.0000) |
VestreAD | -6451.9368 (0.0000) | -.3759 (0.0000) | -.3253 (0.0000) |
OstensjoD | -5716.0117 (0.0000) | -.3327 (0.0000) | -.3213 (0.0000) |
Konstantledd | 10247.338 (0.0000) | 9.2145 (0.0000) | 7.7140 (0.0000) |
R2 | .7898 | .8122 | .7846 |
Justert R2 | .7702 | .7947 | .7645 |
VIF max | 5.14 | 5.14 | 5.19 |
VIF snitt | 2.21 | 2.21 | 2.15 |
Vi ser fra tabellen ovenfor at R2 er relativt høy for alle regresjonsmodellene, med verdier på 0,7898, 0,8122 og 0,7846 for henholdsvis lineær, semilogaritmisk og dobbeltlogaritmisk regresjonsfunksjon. Dermed kan vi si at regresjonsmodellene har en relativt høy forklaringskraft, og dette gir indikasjon på at det er gode modeller. For den lineære og den semilogaritmiske regresjonsmodellen ser vi at koeffisientene tilhørende variablene etasje, delvis møblert, TV-abonnement inkludert, internett inkludert og tilgang til bod ikke er signifikante. Det vil si at de har en p-verdi på mer enn 0,05, og vi kan ikke si at de har en signifikant påvirkning på den avhengige variabelen. For dobbeltlogaritmisk regresjonsmodell finner vi at variablene delvis møblert, TV-abonnement og balkong ikke er signifikante. I tillegg ser vi at fortegnet på regresjonskoeffisientene knyttet til variabelen bod er negativt i
alle tre funksjonene, noe som ikke er helt logisk. Fortegnet indikerer at månedsleien synker når det er tilgang på bod, som ikke faller naturlig. Denne koeffisienten er som nevnt ikke signifikant for den lineære og semilogaritmiske funksjonen, så her kan tilfeldigheter, ikke tilstrekkelig med data eller andre forhold gjøre retningen på koeffisienten ulogisk. De øvrige variablene har koeffisienter som viser en signifikant påvirkning på månedsleien.
Primærromstørrelse har positiv påvirkning på månedsleien for alle tre regresjonsmodellene, som vil si at en økning i størrelse vil øke månedsleien. For den lineære modellen vil koeffisienten for primærromstørrelse indikere at en økning i størrelsen på leiligheten med 1 m2, vil øke totalprisen med 93,4437 kr. Koeffisienten fra den semilogaritmiske funksjonen viser at en økning i primærromstørrelse på 1 m2 vil øke totalpris med 0,53 %. For den dobbeltlogaritmiske modellen vil en 1 % økning i primærromstørrelse gi en økning i totalpris på 0,5117 %. For variabelen antall soverom, viser koeffisienten i den lineære modellen at en økning på ytterligere ett soverom vil øke månedsleien med 1794,87 kr. For semilogaritmisk modell viser koeffisienten at en økning med ett soverom øker månedsleien med 13,28 %, og for dobbeltlogaritmisk modell vil en 1 % økning i antall soverom øke månedsleien med 0,01
%.
Videre ser vi at alle koeffisientene knyttet til bydelene er signifikante og har negativt fortegn. Vi har utelatt dummyvariabel for sentrum i regresjonen og har dermed denne som referansevariabel. Vi tolker de negative fortegnene slik at det er billigere å leie leilighet i alle bydeler utenfor sentrum. Vi ser også at bydelene nærmest sentrum, her Frogner, St.
Hanshaugen, Grünerløkka og Gamle Oslo, har de minst negative koeffisientene. Bydelene lengst unna sentrum, her Stovner, Xxxxxx Xxxxxxxxxx, Nordstrand og Alna er de som har de mest negative koeffisientene. Dette kan vi tolke slik at månedsleien blir lavere jo lenger unna sentrum man leier leilighet, og tilsvarende høyere jo nærmere sentrum man velger å leie.
Videre vil vi se på hvorvidt regresjonsmodellene vi har estimert for leiemarkedet møter de generelle forutsetningene for regresjonsanalyse. Tabell 6.2 viser de høyeste og gjennomsnittlige VIF-verdiene. For alle tre regresjonsfunksjonene er verdiene lavere enn 10, og det er derfor ingen fare for multikollinearitet. Vi tar deretter for oss spredningen av restleddet og undersøker om det foreligger et klart mønster.
Figur 6.3: Spredning i restledd for leiemarkedet, f.v. lineær, semilog og dobbeltlog
Vi ser fra figurene ovenfor at det ikke foreligger et klart og tydelig mønster i spredningen av restleddet for noen av de tre regresjonsmodellene. For den lineære funksjonen kan det likevel være en antydning til vifteform, som kunne vært klarere om vi hadde hatt flere observasjoner i analysen. Vi vil derfor være forsiktige med å si at det foreligger homoskedastisitet for den estimerte lineære regresjonsmodellen, men for den semilogaritmiske og dobbeltlogaritmiske regresjonsmodellen kan vi si at forutsetningen er oppfylt.
I tillegg ønsker vi å se hvorvidt regresjonsmodellene møter forutsetningen om normalfordelt restledd, altså se hvor godt den tykke blå linjen i figurene nedenfor passer til den rette linjen.
Figur 6.4: Restleddsfordeling for leiemarkedet, f.v. lineær, semilog og dobbeltlog
For den lineære regresjonsmodellen følger ikke den tykke linjen den rette linjen perfekt. Vi kan dermed ikke si at restleddet er symmetrisk fordelt og møter således ikke forutsetningen. For den semilogaritmiske regresjonsmodellen kan man anse restleddets fordeling som symmetrisk, og dermed kan vi si at denne møter forutsetningen om normalfordelt restledd. Også for den dobbeltlogaritmiske regresjonsmodellen ser vi at den tykke linjen ligger ganske godt til den rette linjen, og vi kan anse forutsetningen som møtt.
Etter å ha vurdert hvorvidt de tre regresjonsmodellene møter de generelle forutsetningene for regresjonsanalyse, ser vi at det er den estimerte semilogaritmiske funksjonen som er mest tilfredsstillende både for eiermarkedet og leiemarkedet. Dermed er det den semilogaritmiske funksjonsformen vi vil ta utgangspunkt i for videre analyse.
6.3 Estimering av endelig regresjonsfunksjon
I dette delkapitlet vil vi komme frem til den endelige semilogaritmiske regresjonsfunksjonen vi skal benytte ved beregning av forholdstall i kapittel 7.
6.3.1 Undersøkelse av 𝛾-verdi
For den siden av analysen tilknyttet eiermarkedet har vi tidligere benyttet en 𝛾-verdi på 0,87 når vi har behandlet fellesgjelden. Vi ønsker videre å undersøke om det er en annen 𝛾-verdi
som vil gi en bedre modell. I tabellen under har vi estimert semilogaritmisk funksjon for Totalpris=Omsetningspris+𝛾*fellesgjeld med forskjellige verdier for 𝛾.
Tabell 6.3: Test for ulike 𝛾-verdier
𝛾 | R2 |
0,82 | 0,8505 |
0,83 | 0,8506 |
0,84 | 0,8506 |
0,85 | 0,8507 |
0,86 | 0,8508 |
0,87 | 0,8509 |
0,88 | 0,8509 |
0,89 | 0,8510 |
0,90 | 0,8510 |
0,91 | 0,8511 |
0,92 | 0,8511 |
0,93 | 0,8511 |
0,94 | 0,8511 |
0,95 | 0,8512 |
0,96 | 0,8512 |
0,97 | 0,8512 |
0,98 | 0,8512 |
0,99 | 0,8512 |
1,00 | 0,8512 |
Vi undersøker om R2 øker når vi øker eller reduserer 𝛾-verdien. Vi kan se at forklaringskraften er høyest for 𝛾-verdier som strekker seg fra 0,95-1. Her finner vi at R2 er høyere enn når vi benyttet 𝛾=0,87. Siden forklaringskraften er uendret ved 𝛾-verdier i intervallet 0,95-1, har vi valgt å benytte gjennomsnittet på 𝛾=0,975 når vi skal re-estimere den semilogaritmiske regresjonsfunksjonen.
6.3.2 Re-estimering av regresjonsfunksjon
Videre har vi re-estimert den semilogaritmiske regresjonsfunksjonen for eiermarkedet med en
𝛾-verdi på 0,975. For leiemarkedet hadde vi problemer med at noen av koeffisientene til de uavhengige variablene ikke ble signifikante. Dermed har vi endret dummyvariablene for TV-
abonnement og internett til én numerisk variabel kalt TVInternett. Denne variabelen består av priskomponenter på henholdsvis 650 kr for internett og 450 kr for tv-abonnement. Disse prisene er basert på faktiske priser vi har hentet fra Xxx.xx (2018) og Xxxxxxx.xx (2018), da disse var de tilbyderne vi fant som hadde separate priser for hver av tjenestene de leverer. Vi har i tillegg omgjort dummyvariablene knyttet til møblering til én numerisk variabel kalt MobNum, der kategoriene umøblert, delvis møblert og møblert har fått verdier på henholdsvis 0, 1 og 2. Under følger den re-estimerte semilogaritmiske funksjonen for både eiermarkedet og leiemarkedet, med variablene, tilhørende koeffisienter og p-verdier.
Tabell 6.4: Re-estimert semilogaritmisk funksjon for eiermarkedet og leiemarkedet, p-verdi i parentes
Variabel | Semilog eiermarkedet N=2538 | Semilog leiemarkedet N=306 |
Primrromm2 | .0111 (0.0000) | .0054 (0.0000) |
Alder | -.0008 (0.0000) | |
BorrettslagD | -.0670 (0.0000) |
SelveierFD | -.0398 (0.0000) | |
Antallsoverom | .1307 (0.0000) | |
Etasje | .0038 (0.4393) | |
MobNum | .0463 (0.0000) | |
TVInternett | .0527 (0.0014) | |
StrmD | .0884 (0.0001) | |
BalkD | .0439 (0.0092) | |
HeisD | .0568 (0.0015) | |
BodD | -.0017 (0.9171) | |
AlnaD | -.5059 (0.0000) | -.4112 (0.0000) |
BjerkeD | -.3445 (0.0000) | -.3408 (0.0000) |
FrognerD | -.2366 (0.0000) | |
GamleOD | -.1915 (0.0000) | -.2525 (0.0000) |
GrorudD | -.5446 (0.0000) | -.3996 (0.0000) |
GrunerD | -.1262 (0.0000) | -.2353 (0.0000) |
NordreAD | -.0996 (0.0000) | -.4331 (0.0000) |
NordstrandD | -.3088 (0.0000) | -.4454 (0.0000) |
SageneD | -.1045 (0.0000) | -.3185 (0.0000) |
SentrumD | -.1875 (0.003) | |
StHanshD | -.0514 (0.0000) | -.2419 (0.0000) |
StovnerD | -.6446 (0.0000) | -.4454 (0.0000) |
SondreND | -.6353 (0.0000) | -.4652 (0.0000) |
UllernD | -.1575 (0.0000) | -.4071 (0.0000) |
VestreAD | -.2347 (0.0000) | -.3984 (0.0000) |
OstensjoD | -.4000 (0.0000) | -.3531 (0.0000) |
Konstantledd | 14.79 (0.0000) | 9.2164 (0.0000) |
R2 | .8512 | .8088 |
Justert R2 | .8501 | .7925 |
VIF max | 2.28 | 5.12 |
VIF snitt | 1.61 | 2.18 |
I tabellen ovenfor har vi sammenstilt den semilogaritmiske regresjonsfunksjonen for eier- og leieemarkedet. Vi ser at begge modellene har en R2 som er større enn 0,8, som vil si at vi sitter igjen med to estimerte modeller som er meget gode etter modifikasjonene nevnt innledningsvis. For eiermarkedet har alle variablenes koeffisienter signifikant påvirkning på totalprisen. For leiemarkedet er det nå kun koeffisientene tilhørende variablene etasje og bod som ikke er signifikante. At koeffisienten til etasje ikke er signifikant i vår estimerte modell kan ha sammenheng med at det er mange unge som leier, og disse har ofte lite imot å gå i trapper. Hadde det vært flest eldre eller småbarnsfamilier, kunne denne koeffisienten hatt signifikant påvirkning på leiepris, ved at leietakerne kunne vært villige til å betale mer for en leilighet plassert på et lavere plan. Grunnen til at koeffisienten tilhørende bod ikke er signifikant kan også her ha sammenheng med at det er mange unge som leier, og at disse enda ikke har så mange eiendeler som trenger oppbevaringsplass. Fortsatt er fortegnet her ulogisk, som kan ha noe med vårt datamateriale eller andre forhold å gjøre. De øvrige variablene knyttet til leiemarkedet har koeffisienter med signifikant påvirkning på månedsleie.
For eiermarkedet vil en økning i primærromstørrelse på 1 m2 gi en økning i totalpris på 1,11
%. Koeffisienten for alder har en negativ påvirkning på totalpris. Koeffisienten viser at totalprisen vil reduseres med 0,08 % når boligen blir ett år eldre. Vi ser fra tabell 6.4 at koeffisientene for leiligheter med eierformene borettslag og selveier med fellesgjeld er negative. Det vil si at en leilighet med eierform selveier uten fellesgjeld, vil ha en høyere
totalpris enn om leiligheten var en borettslagsleilighet eller selveier med fellesgjeld, da det er selveier uten fellesgjeld som er brukt som referansevariabel i regresjonen.
For leiemarkedet vil en økning i primærromstørrelse på 1m2 gi en økning i månedsleie på 5,4
%. Vi ser også at en økning på ett ekstra soverom i en leilighet vil gi en økning i månedsleien på 13,06 %. Koeffisientene til de nye variablene for møblering og TV og internett har nå signifikant påvirkning på månedsleien. Vi har som nevnt gitt de tre underkategoriene av møblering verdiene 0, 1 og 2, for henholdsvis umøblert, delvis møblert og møblert leilighet. Dermed kan vi tolke regresjonskoeffisienten slik at månedsleien vil øke med 2*4,63 % for en møblert leilighet. Regresjonskoeffisienten for TVInternett tolker vi slik at månedsleien vil øke med 5,27 % dersom det er TV- og internett-abonnement inkludert i månedsleien.
Funksjonene knyttet til både eier- og leiemarkedet viser at koeffisientene tilknyttet bydelene fortsatt er negative. Dette vil si at det er dyrere å kjøpe og leie leilighet i henholdsvis Frogner og sentrum, som er utelatt og fungerer som referansevariabler.
Etter re-estimeringen av den semilogaritmiske regresjonsmodellen vil vi igjen undersøke hvor godt modellene møter forutsetningene for regresjonsanalyse. Tabell 6.4 viser at VIF-verdiene er lavere enn 10, og det er dermed ikke fare for multikollinearitet. Restleddets spredning for funksjonene i eiermarkedet og leiemarkedet er vist i diagrammene nedenfor.
Figur 6.5: Spredning i restledd, eiermarkedet til venstre og leiemarkedet til høyre
Spredningen i restleddet for eiermarkedet viser et klarere mønster enn for leiemarkedet. Det kan ha noe med at vi har betydelig flere observasjoner av solgte leiligheter. Det er ingen helt klar tendens til at spredningen har vifteform i noen av figurene ovenfor. Dermed kan vi si at restleddene for begge markedene er homoskedastiske.
I tillegg ønsker vi å se hvorvidt regresjonsmodellene møter forutsetningen om normalfordelt restledd.
Figur 6.6: Restleddsfordeling, eiermarkedet til venstre og leiemarkedet til høyre
Vi ser for begge figurene ovenfor at den tykke blå linjen ligger relativt godt plassert langs den rette linjen, og det er ingen klar indikasjon på større grad av overestimering enn underestimering. Dermed er forutsetningen om normalfordelt restledd også møtt for de re- estimerte regresjonsmodellene.
Videre vil de semilogaritmiske funksjonene vi har estimert ovenfor, bli benyttet i hypotesetesting og ved beregning av forholdstall.
6.4 Hypotesetesting
I kapittel 3 presenterte vi flere hypoteser knyttet til våre problemstillinger. I dette delkapitlet skal hypotesene knyttet til den første problemstillingen testes, ved å foreta en hypotesetest for hver av hypotesene. Testene gjennomføres med utgangspunkt i de re-estimerte semilogaritmiske regresjonsfunksjonene fra STATA. Hypotesetestene for henholdsvis eiermarkedet og leiemarkedet vil blir foretatt hver for seg.
Den første problemstillingen lyder slik:
Hvilke faktorer bestemmer omsetningsprisen? Hvilke faktorer bestemmer leieprisen?
6.4.1 Hypotesetester for hypoteser knyttet til eiermarkedet
H1: Primærromstørrelse har positiv effekt på totalpris
H0: Primærromstørrelse har ingen positiv effekt på totalpris HA: Primærromstørrelse har positiv effekt på totalpris
Vi ser at p-verdien for variabelen primærromstørrelse er 0,0000, som betyr at koeffisienten er signifikant på et 5 % nivå, og nullhypotesen kan forkastes med 95 % sikkerhet. Koeffisienten i regresjonsfunksjonen er 0,0111, som viser at totalprisen øker med 1,11 % med en økning på 1 m2 i primærromstørrelse. Koeffisienten for variabelen har dermed positiv effekt på totalprisen, og vi har støtte for alternativhypotesen. Det betyr at nullhypotesen kan forkastes.
H2: Beliggenhet i bydelene som grenser til sentrum gir høyere totalpris enn beliggenhet i de bydelene som ikke grenser til sentrum
H0: Beliggenhet i bydelene som grenser til sentrum gir ikke høyere totalpris enn beliggenhet i de bydelene som ikke grenser til sentrum
HA: Beliggenhet i bydelene som grenser til sentrum gir høyere totalpris enn beliggenhet i de bydelene som ikke grenser til sentrum
Alle koeffisientene til bydelsdummyene har en p-verdi på 0,0000, og kan dermed påstås å ha en signifikant påvirkning på totalprisen, ut ifra et signifikansnivå på 5 %. Bydelene som grenser til sentrum er Gamle Oslo, Frogner, St. Hanshaugen og Grünerløkka. For å vurdere om disse gir en høyere totalpris enn resten av bydelene, må en se på koeffisientene til hver bydel. Da Frogner er benyttet som referansevariabel, viser koeffisientene til de andre bydelene hvordan de påvirker prisen sett i forhold til Frogner. Alle koeffisientene til bydelene er negative, og dermed er Frogner den med høyest prisnivå i vårt datasett. Vi kan da forkaste nullhypotesen dersom koeffisientene til Gamle Oslo, St. Hanshaugen og Grünerløkka har koeffisienter som er mindre negative enn de andre bydelene. Fra den re-estimerte regresjonsmodellen ser vi at koeffisientene for Sagene og Nordre Aker, som ikke grenser til sentrum, har mindre negative koeffisienter enn noen av bydelene som grenser til sentrum.
Dermed vil vi ikke kunne gi støtte til alternativhypotesen vår og kan ikke forkaste nullhypotesen.
H3: Alder har negativ effekt på totalpris
H0: Alder har ingen negativ effekt på totalpris HA: Alder har negativ effekt på totalpris
Koeffisienten tilhørende variabelen alder har en p-verdi på 0,0000, og er dermed signifikant på et 5 % nivå. Koeffisienten viser -0,0008, som betyr at en økning i alderen på boligen med ett år, reduserer totalprisen med 0,08 %. Alder har dermed med 95 % sannsynlighet en
signifikant negativ effekt på totalprisen, som støtter opp under alternativhypotesen. Nullhypotesen kan i dette tilfellet forkastes.
6.4.2 Hypotesetester for hypoteser knyttet til leiemarkedet
H4: Primærromstørrelse har positiv effekt på månedsleie
H0: Primærromstørrelse har ingen positiv effekt på månedsleie HA: Primærromstørrelse har positiv effekt på månedsleie
P-verdien til koeffisienten tilhørende primærromstørrelse for leiemarkedet er også 0,0000, og koeffisienten viser dermed en signifikant påvirkning på månedsleien på et 5 % nivå.
Koeffisienten til primærromstørrelse er her 0,0054, som viser at månedsleien øker med 0,54
%, med en økning på 1 m2 i primærromstørrelse. Det foreligger dermed støtte for at primærromstørrelse har positiv effekt på månedsleien, og nullhypotesen kan forkastes.
H5: Antall soverom har positiv effekt på månedsleie
H0: Antall soverom har ingen positiv effekt på månedsleie HA: Antall soverom har positiv effekt på månedsleie
En p-verdi på 0,0000 finner vi også for koeffisienten for antall soverom, som dermed er signifikant på et 5 % nivå. Koeffisienten fra regresjonsfunksjonen er her 0,1307, som tilsier at en økning i antall rom med ett rom, fører til en økning i månedsleien på 13,07 %. Antall soverom har dermed positiv effekt på månedsleien med 95 % sannsynlighet. Nullhypotesen kan følgelig forkastes.
H6: Beliggenhet i bydelene som grenser til sentrum gir høyere månedsleie enn beliggenhet i de bydelene som ikke grenser til sentrum
H0: Beliggenhet i bydelene som grenser til sentrum gir ikke høyere månedsleie enn beliggenhet i de bydelene som ikke grenser til sentrum
HA: Beliggenhet i bydelene som grenser til sentrum gir høyere månedsleie enn beliggenhet i de bydelene som ikke grenser til sentrum
Også for vår data for leiemarkedet har alle koeffisientene til bydelsdummyene en p-verdi på 0,0000, og har en signifikant påvirkning på månedsleien ved et signifikansnivå på 5 %.
Sentrum er brukt som referansevariabel og har det høyeste prisnivået i datasettet. Dermed vil
nullhypotesen kunne forkastes dersom regresjonskoeffisientene til bydelene Gamle Oslo, Frogner, St. Hanshaugen og Grünerløkka er minst negative. Sammenliknet med de andre bydelene finner vi at disse fire koeffisientene faktisk er de minst negative. Dermed kan vi med 95 % sannsynlighet si at beliggenhet i bydelene som grenser til sentrum gir en høyere månedsleie enn beliggenhet i de bydelene som ikke grenser til sentrum, for vårt datasett. Dette betyr at vi får vi støtte for alternativhypotesen, og nullhypotesen kan forkastes.
H7: Møblering har positiv effekt på månedsleie
H0: Møblering har ingen positiv effekt på månedsleie HA: Møblering har positiv effekt på månedsleie
Fra regresjonen har koeffisienten til møbleringsvariabelen en p-verdi på 0,0000, og har signifikant påvirkning på månedsleien ved et 5 % nivå. I tillegg har koeffisienten en positiv verdi på 0,0463, som viser at en økning i graden av møblering med 95 % sannsynlighet vil føre til en økning i månedsleien. Vi får dermed støtte for vår alternativhypotese og nullhypotesen kan forkastes.
H8: TV-abonnement, internett og strøm inkludert i månedsleien har positiv effekt på månedsleie
H0: TV-abonnement, internett og strøm inkludert i månedsleien har ingen positiv effekt på månedsleie
HA: TV-abonnement, internett og strøm inkludert i månedsleien har positiv effekt på månedsleie
Ved testing av denne hypotesen må vi se på regresjonskoeffisientene og signifikansindikatorene både for den numeriske variabelen TVInternett, og dummyvariabelen for strøm. En ser at koeffisienten til TVInternett har en p-verdi på 0,0014, og koeffisienten til dummyvariabelen for strøm inkludert har en p-verdi på 0,0001. Begge koeffisientene har dermed en p-verdi som er mindre enn 0,05, og har signifikant påvirkning på månedsleien, ved et 5 % signifikansnivå. I tillegg har begge variabler positive koeffisienter på henholdsvis 0,0527 og 0,0884, som betyr at inkludering av TV-abonnement og/eller internett, og strøm vil øke månedsleien med 95 % sannsynlighet. Nullhypotesen kan dermed forkastes.
For å undersøke om disse koeffisientene tilsvarer rimelige tall, kan vi beregne hvor stor økningen i månedsleie som følge av en økning i de uavhengige variablene er i kroner. Tar en utgangspunkt i den gjennomsnittlige månedsleien under deskriptiv statistikk i kapittel 5 på 14 825,72 kr finner vi at variabelen for TV-abonnement og internett øker månedsleien med omtrent 781 kr, og inkludering av strøm øker månedsleien med omtrent 1311 kr. Beløpet på 781 kr ligger relativt nærme det virkelige samlede beløpet vi har basert variabelen TVInternett på. Det er heller ikke urimelig å tenke seg at en månedlig strømutgift kan være 1311 kr.
7. Beregning av forholdstall
I dette kapitlet vil vi presentere de bearbeidede data som skal svare på hovedproblemstillingen i oppgaven vår. Det som blir gjennomgått her er selve kjernen i avhandlingen. Da det kun er de uavhengige variablene primærromstørrelse og beliggenhet som er felles i datasettene for begge markedene, er det disse variablene vi ønsker å se påvirkningen av når vi skal beregne forholdstall. Et slikt forholdstall forteller om størrelsen på leieprisen er høy eller lav i forhold til totalprisen, og omvendt, for leiligheter som er like med hensyn på størrelse og beliggenhet.
7.1 Benyttede metoder
Vi har benyttet to metoder for å beregne forholdstall i avhandlingen. Den første baserer seg direkte på resultatene fra regresjonsanalysen, mens den andre benytter par av leiligheter og de faktiske prisene i markedene.
7.1.1 Metode I
Tidligere definerte vi to ulike regresjonsfunksjoner, eller modeller, som skal benyttes for å estimere totalpris i eiermarkedet og månedsleien i leiemarkedet. Disse har vi kalt henholdsvis Transaksjonsmodellen og Leieprismodellen.
I regresjonsanalysene i STATA estimerte vi totalprisen og månedsleien som funksjoner av de ulike attributtene ved leilighetene. Vi benytter de re-estimerte semilogaritmiske regresjonsfunksjonene for å estimere priser og forholdstall. Funksjonene er bygget opp av regresjonskoeffisientene til hver av variablene i modellen, og vil teoretisk sett se slik ut:
(7.1) 𝑙𝑛𝑇l𝑃𝐸𝑖𝑒 = 𝛽0 + 𝛽1𝑃𝑟𝑖𝑚æ𝑟𝑟𝑜𝑚𝑖 + 𝛽2𝐴𝑙𝑑𝑒𝑟𝑖 + 𝛽{𝐸𝑖𝑒𝑟𝑓𝑜𝑟𝑚𝑖 + 𝛽4𝐵𝑦𝑑𝑒𝑙𝑖
(7.2) 𝑙𝑛𝑃p𝐿𝑒𝑖𝑒 = 𝛽0 + 𝛽1𝑃𝑟𝑖𝑚æ𝑟𝑟𝑜𝑚𝑖 + 𝛽2𝐴𝑛𝑡𝑎𝑙𝑙 𝑠𝑜𝑣𝑒𝑟𝑜𝑚𝑖 + 𝛽{𝐸𝑡𝑎𝑠𝑗𝑒𝑖 +
𝛽4𝑀ø𝑏𝑙𝑒𝑟𝑖𝑛𝑔𝑖 + 𝛽Å𝑇𝑉𝐼𝑛𝑡𝑒𝑟𝑛𝑒𝑡𝑡𝑖 + 𝛽6𝑆𝑡𝑟ø𝑚𝑖 + 𝛽7𝐵𝑎𝑙𝑘𝑜𝑛𝑔𝑖 +
𝛽Ü𝐻𝑒𝑖𝑠𝑖 + 𝛽à𝐵𝑜𝑑𝑖 + 𝛽10𝐵𝑦𝑑𝑒𝑙𝑖
For å uttrykke totalprisen og månedsleien i hele kroner, må vi sette e opphøyd i uttrykket på høyre side av uttrykkene ovenfor, slik at leieprisen og totalprisen ikke lenger er uttrykt som ln til P: