STOCKHOLM, SVERIGE 2016
EXAMENSARBETE INOM TEKNIK, GRUNDNIVÅ, 15 HP
STOCKHOLM, SVERIGE 2016
Prissättningsanalys av annonser på internet
En analys av variabler som påverkar slutpriset
KTH KUNGLIGA TEKNISKA HÖGSKOLAN SKOLAN FÖR TEKNIKVETENSKAP
XXXXXX XXXXXXXXXX XXXXXXXXXX XXXXXXX
Prissättningsanalys av annonser på internet En analys av variabler som påverkar slutpriset |
G U S T A F E R L A N D S S O N C H R I S T O F E R T Ä R N E L L |
Examensarbete inom teknik: Tillämpad matematik och industriell ekonomi (15 hp) Civilingenjörsutbildning i industriell ekonomi (300 hp) Kungliga Tekniska högskolan 2016 Handledare på KTH: Xxxxxx Xxxxxx, Xxxxxxx Xxxxxxxx Examinator: Xxxxxx Xxxx TRITA-MAT-K 2016:13 ISRN-KTH/MAT/K--16/13--SE Royal Institute of Technology SCI School of Engineering Sciences KTH SCI SE-100 44 Stockholm, Sweden |
Sammanfattning
Den h¨ar rapporten underso¨ker vilka faktorer som p˚averkar prissa¨ttningen av annonser p˚a internet. F¨or att komma fram till ett resultat anva¨ndes statistisk analys p˚a drygt 70000 datapunkter som erholls av fo¨retaget Wiget Media. Mo- dellerna som anv¨ands har anpassats till datan med hja¨lp av regressionsanalys, da¨r genomg˚aende analyser av datan har genomfo¨rts fo¨r att f˚a fram de mest la¨mpliga modellerna. Regressionen utfordes med hja¨lp av mjukvaruprogrammet R och strukturering av datan gjordes med hj¨alp av Excel och Stata. Resultatet av unders¨okningen visar p˚a att la¨nder, kategorier och plattform a¨r variabler som spelar stor roll vid prissa¨ttning.
Rapporten undersoker a¨ven hur man som maklare p˚a internet kan utforma
prissa¨ttningsstrategier. F¨or att komma fram till ett resultat gjordes grundli- ga litteraturstudier om e-prissa¨ttning. Olika prissa¨ttningsstrategier diskuteras och resulterar i en slutsats som rekommenderar maklare p˚a internet att anva¨nda en auktionsbaserad prissa¨ttningsmodell.
Abstract
This thesis investigates factors that affect the prices of online ads. Statistical analysis was applied in order to draw conclusions from the data recieved from the company Wiget Media. Regression analysis was used to derive models to fit the data. The regression was performed with the software R and the structure of the data was handeled with Excel and Scala. The results from the thesis indicates that countries, categories and platforms are important factors when pricing online ads.
Furthermore the thesis investigates and develop a pricing strategy for online borkers. A thorough litterature study regarding online-pricing was performed to derive a pricing strategy suitable for the brokers market and company structure. Different pricing strategies are discussed and conclude in a recommendation to implement an auction-based pricing model.
Fo¨rord
Vi vill rikta ett stort tack till handledarna av uppsatsen, Xxxxxx O¨ nskog och Xxxxxxx Xxxxxxxx, f¨or deras rekommendationer och va¨gledning.
Ett stort tack riktas ¨aven till Wiget Media, da¨r Xxxxx Xxxxxxxxx och Xxxxx Xxxxxx var kontaktpersoner. De tillhandah¨oll data och var va¨ldigt hja¨lpsamma vid utformning av fr˚agesta¨llningen.
Ett stort tack riktas ¨aven till v˚ara klasskamrater som givit feedback p˚a rappor- ten.
Beteckningar
V iewers - Xxxxx visningar av en annons
Price - Pris i CPM
C** - C st˚ar f¨or land, ** st˚ar fo¨r landskoden.
PF - Plattform
OS - Operativsystem
cat - Kategori
TimeInter - Tidsintervall
Inneh˚all
1 Inledning 8
1.1 Bakgrund 8
1.2 Problemformulering och fr˚agest¨allning 8
1.3 Syfte 8
2 Metod 9
2.1 Dataset 9
2.1.1 Databehandling 9
2.1.2 Behandling av avvikelser i datan 9
2.2 Avgr¨ansningar 10
3 Teoretisk bakgrund 11
3.1 Linj¨ar regression 11
3.2 Ordinary Least Square, OLS 11
3.3 Val av kovariat 12
3.4 Akaike Information Criterion (AIC) 12
3.5 Baeysian Information Criterion (BIC) 12
3.6 Skillnader mellan AIC och BIC 13
3.7 Dummyvariabler 13
3.8 F¨orklaringsgrad 13
3.9 P˚averkningsgrad och Xxxxx’x rule 13
3.10 F¨ordelning- och hypotesteori 14
3.10.1 Typ I och typ II fel 14
3.11 F-f¨ordelning 15
3.12 Hypotestest f¨or linj¨ara modeller 15
3.13 Konfidensintervall 15
3.13.1 Bonferroni 16
3.14 Heteroskedasticitet 16
3.14.1 Identifiering och ˚atgardande av heteroskedasticitet 16
3.14.2 Breusch-Pagan test 17
3.14.3 White’s Consistent Variance Estimatior 17
3.15 Problem med heteroskedasticitet 18
3.15.1 Endogenitet 18
3.15.2 Simultanitet och saknad av relevanta kovariat 19
3.16 A˚tg¨arder f¨or endogenitet 19
3.16.1 Instrumentella variabler 19
3.16.2 Durbin-Wu-Hausmann test 19
3.16.3 2-SLS 19
3.17 Multikollinj¨aritet 20
3.17.1 Imperfekt multikollinj¨aritet 20
3.17.2 Perfekt multikollinj¨aritet 20
3.18 Variance Inflation Factor (VIF) 20
4 Unders¨okning och behandling av dataset och modell 22
4.1 Fo¨rklaring av kovariat 22
4.1.1 V iewers 22
4.1.2 Price 22
4.1.3 Plattform 22
4.1.4 OS 22
4.1.5 Land 22
4.1.6 Tid 23
4.1.7 Kategori 23
4.2 Test av heteroskedasticitet 23
4.3 Uppst¨allning av modell 24
4.4 Reducering av modell 25
4.5 Unders¨okning av multikollinj¨aritet genom VIF-test 25
4.6 QQ-plot 26
4.7 Endogenitet 27
5 Resultat 30
5.1 Regressionens koefficienter 30
5.1.1 P˚averkan fr˚an viewers 30
5.1.2 P˚averkan fr˚an l¨ander 30
5.1.3 P˚averkan fr˚an plattform 31
5.1.4 P˚averkan fr˚an OS 32
5.1.5 P˚averkan fr˚an tiden 33
5.1.6 P˚averkan fr˚an kategorierna 33
6 Diskussion 35
6.1 Kovariat 35
6.1.1 Viewers 35
6.1.2 Plattform 35
6.1.3 Operativsystem (OS) 35
6.1.4 Kategori 36
6.1.5 Land 36
6.1.6 Tid 36
7 Slutsats 37
8 Priss¨attningsstrategi fo¨r m¨aklare p˚a internet 38
8.1 Introduktion 38
8.1.1 Typer av annonsering 38
8.2 Avgr¨ansning 38
8.3 M¨aklare p˚a internet 39
8.4 Generell int¨aktsmodell 39
8.5 Digitala annonser 39
8.6 Marknadsekonomi 40
8.7 Priss¨attningsteori 41
8.8 Grundl¨aggande priss¨attningsmodeller 42
8.8.1 Xxxxx priss¨attning 42
8.8.2 Priss¨attning efter anv¨andning 43
8.8.3 Priss¨attning efter belastning 43
8.9 Dynamisk priss¨attning 43
8.9.1 Annonserad priss¨attning 44
8.9.2 Auktionsbaserad priss¨attning 44
8.9.3 Kvantitet priss¨attning 44
8.10 Utbud och efterfr˚agan p˚a marknaden under ett dygn 44
8.11 M¨ojliga metoder fo¨r att mo¨ta andringar i efterfr˚agan 45
8.11.1 Surge-priss¨attning (U¨ bers prissa¨ttningsmodell) 46
8.11.2 Auktionsbaserad prissa¨ttning med begra¨nsade resurser 47
9 Diskussion 49
9.1 Annonserad priss¨attning 49
9.2 Auktionsbaserad priss¨attning 49
9.3 Kvantitet priss¨attning 50
10 Slutsats 50
Referenser 51
11 Appendix 53
11.1 Resultat fr˚an regression med alla kovariat 53
11.2 Resultat fr˚an regression utan CAT 54
11.3 Resultat fr˚an regression utan CAT och catLinkShortener 55
11.4 Resultat fr˚an regression utan CAT, catLinkShortener och CDE . 56
11.5 Resultat fr˚an regression utan CAT, catLinkShortener, CDK och catDownloadSitesAdultContent 56
11.6 Konfidensintervall f¨or slutgiltiga modellen 57
Figurer 58
Tabeller 58
1 Inledning
1.1 Bakgrund
Under det senaste decenniet har marknadsf¨oring p˚a internet blivit allt vanli- gare och det investeras i dagsl¨aget stora summor pengar p˚a att marknadsfo¨ra sig online. Allt fr˚an reklamkampanjer som kommuniceras till kund via vide- os till annonser p˚a webbplatser som ¨ar t¨ankt att vara riktad till den specifi- ka anv¨andaren. Annonser sa¨ljs via n˚agot som kan liknas vid en ma¨klare, da¨r ma¨klaren besta¨mmer trafiken p˚a hemsidan, inneba¨randes att de har ra¨tt att va¨lja vad som ska visas fo¨r anva¨ndaren. Fo¨retag kan ko¨pa ra¨tt till annonsplats p˚a dessa hemsidor. Vilka komponenter som spelar sto¨rst roll i prissa¨ttningen av dessa annonsplatser ¨ar vad den h¨ar rapporten kommer behandla.
Wiget Media ¨ar ett av m˚anga fo¨retag som agerar som ma¨klare av annonser
p˚a hemsidor. Det ¨ar ett fo¨retag som haft god tillva¨xttakt p˚a annonsmarknaden p˚a senare tid, d¨ar den egentliga konkurrensen ligger i att skapa en effektiv algoritm samt program. Detta f¨or att p˚a ett enkelt sa¨tt kan distribuera trafik p˚a hemsidorna samtidigt som man h¨amtar ut information om anva¨ndaren fo¨r att kunna rikta annonserna till den specifika anva¨ndaren. Eftersom affa¨rsmodellen g˚ar ut p˚a att s¨alja fo¨r s˚a mycket som mo¨jligt men samtidigt inte ha fo¨r stora kostnader sj¨alva har f¨oretagets fokus endast legat p˚a kod och effektivisering av befintliga system. Wiget Media har da¨rf¨or ingen tydlig uppfattning ang˚aende vilka faktorer som spelar in p˚a priss¨attningen, det vill sa¨ga om det finns variabler som ger st¨orre effekt a¨n andra for det slutgiltiga priset. Av den anledningen ar faktorer som p˚averkar priss¨attningen av annonser p˚a internet ett aktuellt omr˚ade att studera. Dels f¨or foretaget som inte har n˚agon egen utva¨rdering av prissa¨ttningen samt att det a¨r intressant for marknaden i stort d˚a det inte finns n˚agon liknande studie som har gjorts.
1.2 Problemformulering och fr˚agest¨allning
Fr˚agest¨allningarna som behandlas i kandidatexamensarbetet lyder som fo¨ljande:
i) ”Vilka variabler p˚averkar prissa¨ttningen av annonser p˚a internet mest?”
Det a¨r ocks˚a av intresse att underso¨ka hur man utformar prisstrategier fo¨r ma¨klare p˚a internet, darav formuleras INDEK-fr˚agan som fo¨ljande:
ii) ”Hur kan en prisstrategi f¨or ma¨klare p˚a internet utformas?”
1.3 Syfte
Arbetets syfte ¨ar att analysera de olika faktorerna som p˚averkar prissa¨ttningen av annonser p˚a internet. Detta g¨ors med hja¨lp av statistiska metoder. Arbetet ar ta¨nkt att bidra till att identifiera och definiera de mest va¨sentliga fakto- rerna i priss¨attningen av annonser p˚a internet, samt hur ma¨klare p˚a internet kan utforma en effektiv priss¨attningsstrategi. Arbetet ska genom ovanst˚aende bidra med relevanta resultat f¨or fo¨retaget Wiget Media, som a¨r fo¨retaget som tillhandah˚aller datan som analysen grundar sig p˚a.
2 Metod
Den h¨ar rapporten ¨ar uppdelad i tv˚a delar. I den fo¨rsta delen underso¨ks vilka faktorer som spelar st¨orst roll vid priss¨attning av annonser p˚a internet. I den andra delen av rapporten utformas en priss¨attningsstrategi fo¨r ma¨klare p˚a in- ternet. F¨or att komma fram till ett resultat ga¨llande fo¨rsta delen av rapporten gjordes f¨orst en litteraturstudie inom regressionsanalys. Da¨refter applicerades teorin p˚a en upps¨attning datapunkter f¨or att f˚a fram ett resultat. Utifr˚an resul- taten drogs slutsatser om vilka faktorer som p˚averkar priset mest.
I den andra delen av rapporten gjordes en litteraturstudie om grundla¨ggande prissa¨ttningsmodeller samt en studie av dynamiska prissa¨ttningsmodeller fo¨r att kunna besvara rapportens fr˚agestallning. Utifr˚an fakta fr˚an litteraturstudien och konkreta exempel utformades en priss¨attningsstrategi som ma¨klare p˚a internet kan applicera.
2.1 Dataset
M˚alet med rapporten ¨ar att anva¨nda data fr˚an annonsmarknaden fo¨r att kunna ge ett precist svar p˚a fr˚agan om vilka faktorer som p˚averkar priset mest. Data- setet som anv¨ands f¨or att besvara den f¨orsta fr˚agesta¨llningen tillhandaho¨lls av fo¨retaget Wiget Media, som ¨ar ett av m˚anga fo¨retag som agerar som ma¨klare p˚a annonsmarknaden. Innan behandling av datan bestod datasetet av drygt 70000 datapunkter.
2.1.1 Databehandling
Datan analyserades med multipel linj¨ar regression fo¨r att dra slutsatser om vilka faktorer som p˚averkar priss¨attning av annonser p˚a internet. Vidare underso¨ktes kovaritens relevans genom konfidensintervallsunderso¨kningar. Responsvariabeln var priset p˚a annonserna och de oberoende variablerna var egenskaperna som definierar annonsen. Omr˚aden som analyseras samt modellerna ˚aterfinns nedan. Variabler som hade liten relevans i modellen sto¨rde resultaten av den. Ge- nom verktyg inom regressionsanalys kan man fastst¨alla om en variabel ska vara med i modellen eller inte. Det finns tv˚a typer av verktyg fo¨r att analysera vari- ablernas relevans, grafiska metoder och signifikanstest metoder. De grafiska me- toderna inneb¨ar att man tittar p˚a plottar av residualen mot data, histogram och sannolikhetsfo¨rdelning etc. Grafiska unders¨okningsmetoder som gjordes i denna rapport var, QQ-plot och unders¨okning av endogenitet samt heteroskedasticitet genom plot. Signifikanstester som anv¨andes var P-va¨rdes test och F-test genom Breusch-Pagan f¨or att testa hetroskedasticitet samt VIF-test fo¨r att underso¨ka
mulitkollinja¨ritet i variabler.
Bera¨kningarna fo¨r dessa metoder utf¨ordes i R, dock gjordes viss strukture- ring och sortering av datan med hja¨lp av Excel och Scala.
2.1.2 Behandling av avvikelser i datan
Vid inspektion av data uppt¨acktes flertalet problem och avvikelser. En del av datan gick ej att anv¨anda i modellen d˚a de skulle generera fel i skattningen av kovariaten. Till en b¨orjan skapades en modell som var ta¨nkt att vara anpassad till hela datasetet, men efter flertalet fo¨rsok och ytterliggare inspektion av datan
kunde inte en modell med tillr¨ackligt hog validitet skapas. En fo¨rsta ˚atga¨rd blev att ta bort extrempunkter i datan, vilket innebar att extremt ho¨ga va¨rden p˚a priset togs bort. A¨ ven datapunkter med l˚agt pris och f˚a antal V iewers togs
bort d˚a det f¨or fo¨retaget ar intressant att underso¨ka annonserna som har sto¨rre p˚averkan p˚a inta¨kterna.
Det uppstod ¨aven en dummyvariabel som var sv˚ar att tolka, enligt datan tolkades ett operativsystem som Unknown. Denna variabel anses vara ett fel i datan d˚a f¨oretagets system inte kan identifiera ett specifikt operativsystem. Den- na variabel ˚aterfanns bara i ˚atta datapunkter och togs da¨rfo¨r bort d˚a p˚averkan p˚a resultatet var liten. Det fanns ytterligare ett operativsystem som inte la¨stes av korrekt fr˚an foretaget. WindowsPhone tolkades som en stationa¨r plattform men d˚a detta ¨ar om¨ojligt ans˚ags a¨ven denna vara felaktigt, da¨rfo¨r plockades a¨ven datan med denna variabel bort.
2.2 Avgr¨ansningar
Datama¨ngden ¨ar stor och avgra¨nsningar av antal datapunkter m˚aste go¨ras.
Uto¨ver begra¨nsningen av datapunkter begra¨nsas arbetet a¨ven till att endast behandla l¨ander inom Europa samt ett f˚atal kategorier av hemsidor fo¨r att mo¨jliggo¨ra en effektiv modell. Valet av begra¨nsningarna ovan gjordes i samtyc- ke med Wiget Media med motiveringen att det a¨r de sto¨rre marknaderna och vissa utvalda variabler som a¨r mest intressanta.
3 Teoretisk bakgrund
3.1 Linj¨ar regression
Σ
Inom matematisk statistik ¨ar linja¨r regression en vanlig metod att anva¨nda. Metoden anv¨ands n¨ar man vill forklara en beroende responsvariabels p˚averkan fr˚an en samling oberoende variabler, ¨aven kallat kovariat. Fo¨rh˚allandet mellan dessa beskrivs av fo¨ljande ekvation:
yi = xikβk + ei (1)
Som kan skrivas som fo¨ljande:
y1
Y = Xβ + e
Dar Y = , X = , β = , e =
y2 1 x2,1 x2,2 . . . x2,k β1 e2
1 x1,1 x1,2 . . . x1,k
β0
e1
.
yn
. . . . . . .
1 xn,1 xn,2 . . . xn,k
.
βk
.
en
I ekvation (1) ¨ar y den beroende variabeln. Variabeln beskrivs av kovariaten xi samt feltermen ei . D¨ar ei antas vara oberoende mellan observationerna och va¨nteva¨rdet σ ok¨ant s˚adant att:
i
E[ei] = 0 och E[e2] = σ2
Det sista f¨orh˚allandet g¨aller endast vid homskedasticitet och inte vid hetros- kedsticitet, vilket tas upp i ett senare avsnitt. [1]
Den f¨or modellen bera¨knade βi anger fo¨rh˚allandet mellan en fo¨ra¨ndring i responsvariabeln y motsvarande en ¨andring i kovariatet xi s˚adan att:
δy
βi = δx (2)
3.2 Ordinary Least Square, OLS
βˆ ¨ar ok¨and och uppskattas for att kunna beskriva fo¨rh˚allandet mellan respon- svariabeln yi, kovariaten xi och feltermen ei. Ett sa¨tt att uppskatta β a¨r genom metoden OLS, vilken minimerar kvadratsumman av feltermen e2. Det uppskat- tade β betecknas som βˆ. Genom en omskrivning av normalekvationen nedan kan βˆ uppskattas:
Xteˆ = 0 (3)
Genom ins¨attning av ekvation (1) i (3) f˚as en OLS estimation av βˆ s˚adan att:
βˆ = (XtX)−1XtY (4)
Kovariansmatrisen av βˆ skrivs som fo¨ljande:
Cov(βˆ) = E[(βˆ − β]E[(βˆ − β)t] = (XtX)−1XtIσ2X(XtX)−1
En opartisk uppskattning fo¨r σ2 ges av:
| |
s2 = 1 eˆ2
n − k − 1
Vilket ger en skattning av kovariansmatrisen som ser ut som fo¨ljande:
Coˆv(βˆ) = (XtX)−1s2
Detta g¨aller endast fo¨r modeller da¨r datan a¨r homoskedastisk, i annat fall kommer den skattade matrisen bli inkonsistent och White’s Consistence Vari- ence Estimator m˚aste appliceras. [1]
3.3 Val av kovariat
Det kan vara sv˚art att avg¨ora vilka kovariat som skall inkluderas i en modell eller ej. Vid val av kovariat finns det tv˚a olika tester fo¨r att avg¨ora om ett kovariat ska vara med i modellen eller inte. AIC-test och BIC-test [1] a¨r de tv˚a testen som anva¨nds fo¨r detta.
3.4 Akaike Information Criterion (AIC)
Fo¨r att ma¨ta den relativa kvalit´en hos en modell givet en uppsa¨ttning data kan AIC anv¨andas. Testet kan ses som avva¨gning mellan “fo¨rklaringsgrad” och modellens komplexitet (antal kovariat). I na¨stan alla fall beskrivs den ba¨sta modellen av den modell som genererar l¨agst resultat hos fa¨ljande uttryck:
AIC = nln(|eˆ|2) + 2k (5)
Ovanst˚aende ekvation (5) identifierar modeller som a¨r o¨verestimerade sett till det optimala. Da¨rf¨or va¨ljer man den modell som ger la¨gst resultat. Denna modell ¨ar den mest l¨ampade och fo¨rh˚allandevis ho¨g fo¨rklaringsgrad sett till andra modeller man kan sta¨lla upp med samma dataset [2] [1].
3.5 Baeysian Information Criterion (BIC)
Ett annat s¨att att ma¨ta den relativa kvalit´en hos en modell given en uppsa¨ttning data a¨r att anva¨nda sig av BIC. Man kan se testet som en avva¨gning mellan “fo¨rklaringsgrad” och modellens komplexitet (antal kovariat). Den ba¨sta model- len avgo¨rs efter minimering av fo¨ljande uttryck:
BIC = nln(|eˆ|2) + kln(n) (6)
Ekvation (6) identifierar modeller som a¨r ¨overestimerade och precis som fo¨r AIC-testet v¨aljs den modell som minimerar ekvation (6). Denna modell a¨r den mest l¨ampade och har forh˚allandevis ho¨g fo¨rklaringsgrad. [1]
3.6 Skillnader mellan AIC och BIC
Det a¨r inga st¨orre skillnader mellan AIC och BIC enligt ekvation (5) och (6) ovan. Den enda skillnaden ¨ar den sista termen. AIC har en 2k term medan BIC har en kln(n) term. B˚ada ar ha¨rledda fr˚an samma informationsteori och ramverk men skiljer sig i prioriteringar, da¨r BIC ofta reducerar modellen mer an AIC g¨or. Det mest l¨ampade testet att applicera beror p˚a modellen. [3]
Va¨rt att ta i beaktning a¨r att det inte alltid a¨r optimalt att reducera en modell bara f¨or att testerna sa¨ger sa¨ger det. Na¨r skillnaden mellan tv˚a modeller ar liten ¨ar intuitionen hos den som staller upp modellen la¨mpligare att anva¨nda.
3.7 Dummyvariabler
Info¨randet av dummyvariabler sker p˚a grund av att en del datatyper inte a¨r kvantifierbara. Att dela upp dessa datatyper i dummyvariabler a¨r en effektiv metod att behandla data for att go¨ra den anva¨ndbar. Nedan fo¨ljer en beskrivning av hur en dummyvariabel definieras och anva¨nds.
L˚at xi vara en dummyvaribel som har fo¨ljande egenskaper:
xi = 0, om observationen a¨r inaktiv
xi = 1, om observationen a¨r aktiv
Na¨r xi a¨r aktiv kommer den beroende responsvariabeln o¨ka med βi [1].
Fo¨r att unders¨oka skillnader mellan ko¨n kan man info¨ra en dummyvariabel vilken utreder om en observation ¨ar en kvinna eller ej. Det skulle kunna se ut som fo¨ljande:
xi = 0, om det a¨r en man
xi = 1, om det a¨r en kvinna
3.8 Fo¨rklaringsgrad
R2 ¨ar beteckningen f¨or fo¨rklaringsgrad inom statistik. Konstanten fo¨rklarar hur bra modellen ¨ar anpassad till datan. R2-koefficienten anger hur bra variationen i den beroende variabeln y som kan fo¨klaras av variation i de oberoende variab- lerna x. M˚alet ¨ar att uppn˚a ett ho¨gt va¨rde fo¨r att minimera feltermerna och ha en v¨al anpassad modell till regressionslinjen.[4] R2 definieras som fo¨ljande:
V ar(Y )
V ar(Y )
R2 = V ar(Xβˆ) = 1 − V ar(eˆ)
(7)
Ett R2 v¨arde na¨ra 1 visar p˚a att modellen a¨r va¨l anpassad till datan, medan ett l¨agre va¨rde indikerar att modellen inte tar ha¨nsyn till alla feltermer.
3.9 P˚averkningsgrad och Xxxxx’x rule
P˚averkningsgraden eller effektstorleken m¨ater hur stor p˚averkan ett kovariat har p˚a en modell. Till skillnad fr˚an signifikanstest a¨r effektstorleken oberoende av storleken p˚a datan. [5] Effektstorleken kan uttryckas p˚a flera sa¨tt, men i rapporten kommer den endast uttryckas som η2. η2 definieras som fo¨ljande:
η2 = effect
eˆ2
eˆ
2
total
(8)
Da¨r eˆ
2
effect
¨ar kvadratsumman av p˚averkan fr˚an kovariaten som underso¨ks
och eˆ
2
total
¨ar kvadratsumman av alla kovariat. Fo¨r att avgora hur st˚ar p˚averkan
ett kovariat har, kan man anvanda sig av Xxxxx’x rule. Xxxxx’x rule a¨r en
tumregel f¨or att avgo¨ra p˚averkan hos ett kovariat, da¨r Cohen definierat storleken av p˚averkan i kategorierna small, medium och large [6].
Xxxxx’x tumregel
Impact: Small Medium Big
η2 : 0.02 0.13 0.26
3.10 Fo¨rdelning- och hypotesteori
Fo¨r att kunna dra slutsatser om en uppsa¨ttning data beho¨ver man go¨ra ett hypotestest. Den vanliga processen fo¨r testet a¨r:
1. Definiera nollhypotesen H0 samt en alternativ hypotes H1.
2. G¨or ett statistiskt antagande om datan, exempelvis om datan a¨r oberoende eller ett antagande ga¨llande observationernas fo¨rdelning.
3. Best¨am vilket test som ska anva¨ndas och definiera testet fo¨r relevant F- statistika.
4. Definiera en signifikansniv˚a α ,vilket ¨ar den la¨gsta niv˚a som nollhypotesen kommer f¨orkastas p˚a. Oftast anv¨ands en signifikansniv˚a p˚a 5%.
5. Den erh˚allna f¨ordelningen kommer dela upp F-statistikan i tv˚a delar, en da¨r nollhypotesen fo¨rkastas med sannolikhet α och en da¨r nollhypotesen inte fo¨rkastas.
6. Bera¨kna Fobs kopplat till F-statistika.
7. Slutligen f¨orkastar man eller beh˚aller nollhypotesen. Hypotesen fo¨rkastas med signifikansniv˚an α om Fobs ligger utanfo¨r konfidensintervallet [7].
3.10.1 Typ I och typ II fel
Ibland dras fel slutsats fr˚an hypotestestet. Dessa ben¨amns Typ I och Typ II fel och definieras nedan som:
• Typ I a¨r felaktigt f¨orkastande av en sann nollhypotes
• Typ II a¨r att ej f¨orkasta en falsk nollhypotes
Risken att detta sker ¨ar med sannolikheten p˚a signifikansniv˚an α fo¨r Typ I fel samt med β f¨or Typ II. Dar β a¨r relaterat till styrkan hos ett statistiskt test som definieras enligt 1 − β.
3.11 F-fo¨rdelning
F-fo¨rdelningen definieras som fo¨rh˚allandet mellan tv˚a chi-kvadrat fo¨rdelningar. P˚a grund av detta f¨orh˚allande a¨r F-fo¨rdelningen fo¨rskjuten ˚at ho¨ger. F-fo¨rdelningen definieras som fo¨ljande [8]:
χ2(n)
χ2 (p)
F (n, p) = n
p
(9)
3.12 Hypotestest fo¨r linj¨ara modeller
Rapporten kr¨aver signifikanstest for flera kovariat. Detta go¨rs genom att de- finiera en nollhypotes f¨or att testa en grupp av kovariat p˚a signifikansniv˚a α:
H0 :βi = 0, ∀i = 1, 2, ..., n , n ∈ N
H1 :βi 0, ∀i = 1, 2, ..., n , n ∈ N
Na¨r man go¨r ett signifikanstest fo¨r en koeffecient βi adderas restriktioner till modellen. Om man testar f¨or n restriktioner, ko¨rs fo¨rst regressionen utan
restriktionerna (βi 0) f¨or att besta¨mma eˆ. Sedan ko¨rs regressionen igen under
restriktion (βi = 0) fo¨r att kunna besta¨mma eˆ∗. F-statistiken ser da¨rfo¨r ut som fo¨ljande:
2
n − k − 1 |eˆ |
F = (
r |
∗2
eˆ |
− 1) (10)
F a¨r F (r, n − k − 1) fo¨rdelad[1]. Testet ser ut som fo¨ljande: Fo¨rkasta H0 om F > Fα(r, n − k − 1)
Da¨r Fα(r, n − k − 1) a¨r den kumulativa distributionsfunktionen.
3.13 Konfidensintervall
Fo¨r att med sa¨kerhet kunna fastst¨alla att ett kovariat ger ett positivt eller negativt utslag mot benchmarken ¨ar det viktigt att underso¨ka kovariatets konfi- densintervall. A¨ r det endast positivt eller endast negativt kan man dra slutsatsen
−
att effekten av kovariatet p˚a modellen antingen ger ett positivt eller negativt ut- slag. Inneh˚aller konfidensintervallet m¨angden 0 kan man inte dra n˚agon slutsats vilken p˚averkan kovariatet har. Det vanligaste sa¨ttet att underso¨ka konfidensin- tervallet hos ett enskilt kovariat βi p˚a signifikansniv˚an 1 α a¨r genom fo¨ljande ekvation:
√
βi = βˆi ± Fα(1, n − k − 1)SE(βˆi) (11)
Da¨r Fα(1, n−k−1) a¨r den kumulativa distributionsfunktionen med en frihets- grad i ta¨ljaren och n−k− 1 frihetsgrader i na¨mnaren, SE(βˆi) a¨r den estimerade feltermen fo¨r βˆi [1].
3.13.1 Bonferroni
Na¨r man underso¨ker en hypotes f¨or flera kovariat samtidigt m˚aste man korrigera fo¨r detta i testet av konfidensintervallet. Ett vanligt sa¨tt att underso¨ka hypotesen fo¨r flera kovariat samtidigt a¨r att anva¨nda Xxxxxxxxxx. Det a¨r ett test som a¨r likt det vanliga testet f¨or konfidensintervall, men det a¨r korrigerat fo¨r antalet kovariat man unders¨oker samtidigt. Signifikansniv˚an man underso¨ker hypotesen
α
p˚a blir da¨rfo¨r 1 − #r , d¨ar α st˚ar f¨or vilken signifikansniv˚a man vill underso¨ka
och d¨ar #r st˚ar fo¨r antalet kovariat som underso¨ks i hypotestestet [1].
3.14 Heteroskedasticitet
Σ
Den linja¨ra regressionsmodellen beskrivs som fo¨ljande:
yi = xikβk + ei
Antagandet f¨or homoskedasticitet, som a¨r det vanligaste fo¨rekommande an- tagandet a¨r att feltermerna ei har samma standardavvikelse σ, vilket beskrivs enligt fo¨ljande:
i
E[ei] = 0 och E[e2] = σ2
Men d˚a feltermerna kan vara normalf¨ordelade inneba¨r det att ovanst˚aende kriterium inte alltid ¨ar uppfyllt, d˚a definieras feltermerna enligt fo¨ljande:
i
i
i
E[ei] = 0, E[e2] = σ2 och E[e4] < ∞
Ovan ses definitionen f¨or hur feltermerna hos en heteroskedstisk modell be- skrivs, vilket k¨annetecknas av att feltermerna ei inte antar samma va¨rden fo¨r alla termer [1].
3.14.1 Identifiering och ˚atg¨ardande av heteroskedasticitet
Har man felaktigt definierat en modell som homoskedastisk fast den egentli-
gen a¨r heteroskedstisk kommer man st¨ota p˚a problem. Parametriseringarna
blir inkonsistenta p˚a grund av den felaktiga specificeringen att standardavvi- kelsen f¨or varje felterm antar samma va¨rde. Detta leder till att eventuella F-test kopplat till resultatet av regressionen blir ogiltig. Det ¨ar da¨rfo¨r viktigt att un- derso¨ka om man har heteroskedasticitet i en modell, vilket man p˚a ett enkelt och ¨oversk˚adligt sa¨tt kan go¨ra genom att plotta feltermen eˆ fo¨r regressionen p˚a den beroende variabeln Y (se Figur1).
Figur 1: Homoskedasticitet vs Hetroskedasticitet
3.14.2 Breusch-Pagan test
Ett annat s¨att att identifiera heteroskedasticitet i en modell a¨r att applicera Breusch-Pagan test f¨or heteroskedasticitet. Man underso¨ker d˚a ifall den estime- rade variansen V ar(eˆ) ¨ar beroende av kovariaten som anva¨nds i modellen. Om den estimerade variansen ¨ar beroende av kovariaten betyder det att modellen a¨r heteroskedstisk.
Som tidigare definierat ¨ar ett villkor f¨or homoskedasticitet att E[e2] = σ2, vil-
i i
ket betyder att variansen inte ¨ar beroende p˚a kovariaten. Fo¨r att utfo¨ra Breush-
Pagan testet beh¨over man variansen f¨or modellen vilket man kan f˚a ut genom att ta medelv¨ardet av alla kvadrerade feltermer eˆ2, sedan sta¨ller man upp sin hypotes vilket kan se ut som fo¨ljande:
H0 : Modellen a¨r homoskedastisk
H1 : Modellen a¨r heteroskedastisk
Da¨refter k¨ors en regression p˚a eˆ2 som oberoende variabel med kovariaten
X, regressionen beskrivs som fo¨ljande:
eˆ2 = Xβ + u, d¨ar u a¨r notationen fo¨r regressionens felterm.
Man kan testa hypoteserna genom att k¨ora ett F-test. Om F-testet kan kon- firmera att variablerna ¨ar beroende (jointly significant) fo¨r den signifikansniv˚an man vill unders¨oka kan nollhypotesen fo¨rkastas givet att man testar fo¨r homos- kedasticitet [10].
3.14.3 White’s Consistent Variance Estimatior
Det finns ytterligare tillv¨agag˚angssatt fo¨r att handskas med heteroskedasticitet. En m¨ojlig l¨osning fo¨r att minska heteroskedasticiteten a¨r att anva¨nda sig av White’s Consistent Variance Estimator som utg˚ar fr˚an att βˆ a¨r en unbaised estimering av β, det vill s¨aga E(βˆ) = β. Kovariansmatrisen beskrivs s˚aledes som fo¨ljande:
cov(βˆ) = (XtX)−1XtD(eˆ2)X(XtX)−1 (12)
i
I ekvation (12) ¨ar D(eˆ2) en diagonalmatris av storleken n x n med diago- nalen fylld av elementen eˆ2. Till ovanst˚aende formel beho¨vs en modifikation,
n
vilket ¨ar att en faktorterm om n − k − 1 bo¨r multipliceras med uttrycket. Det-
n
ta eftersom man vill minimera summan av |eˆ2|. Men na¨r detta go¨rs utan den na¨mnda modifikationen underestimeras det verkliga va¨rdet av |e2|, da¨rfo¨r la¨ggs
termen
n − k − 1
som agerar som en typ av ad-hoc kompensation. Den mer
robusta kovariansmatrisen beskrivs da¨rfo¨r som fo¨ljande [1]:
coˆv(βˆ) = (XtX)−1XtD(eˆ2)X(XtX)−1 n
n − k − 1
(13)
3.15 Problem med heteroskedasticitet
3.15.1 Endogenitet
Endogenitet uppst˚ar ifall feltermen eˆ ¨ar v¨al korrelerad med en eller flera kovariat som ing˚ar i modellen. Det h¨ar f˚ar konsekvenser i form av att resultaten fr˚an OLS-regressionen blir inkonsistenta [13]. Om man missta¨nker att ett eller flera kovariat i en modell kan bidra till endogenitet kan man underso¨ka dessa variabler genom en plott med feltermen eˆ p˚a y-axeln mot det valda kovariatet p˚a x-axeln. Om det visar sig att det finns en linj¨ar trend i plotten mellan dessa visar det p˚a endogenitet.
Figur 2: Endogenitet
I ovanst˚aende figur ses ett exempel p˚a en plott mellan variabler som a¨r endogena. P˚a y-axeln ˚aterfinns feltermerna fr˚an regressionen fo¨r den modell man unders¨oker och p˚a x-axeln ar variabeln som underso¨ks fo¨r endogenitet. Anledningen till att plotten ovan visar p˚a endogenitet a¨r fo¨r att feltermerna ar beroende av variabeln p˚a x-axeln vilket illustreras genom den linja¨ra (ro¨da) linjen.
3.15.2 Simultanitet och saknad av relevanta kovariat
I rapporten finns det m¨ojlighet att st¨ota p˚a endogenitet i modellerna, vilket skulle kunna uppst˚a p˚a grund av simultanitet. Simultanitet inneba¨r att den oberoende variabeln Y ¨ar korrelerad med en eller flera av kovariaten vilket blir ett problem d˚a orsak och samband f˚ar betydelse fo¨r resultatet av korrelerade variablerna, vilka p˚averkas i b˚ada riktningarna.
Saknad av relevanta kovariat ar en annan anledning till varfo¨r endogenitet uppst˚ar. Det inneb¨ar att komponenter av feltermen i en modell ibland kan kor- relera med vissa kovariat, som kan identifieras. Fo¨r att ˚atga¨rda problemet a¨r en lo¨sning att la¨gga till det kovariat som saknas, vilket go¨r modellen komplett.
3.16 ˚Atg¨arder fo¨r endogenitet
3.16.1 Instrumentella variabler
Instrumentella variabler inneb¨ar att man med hj¨alp av en eller fler variabler kan beskriva en annan o¨onskad variabel. En instrumentell variabel a¨r effektiv att anv¨anda fo¨r att motverka endogenitet hos variabler. Fo¨r att kunna info¨ra en instrumentell variabel kr¨avs det att den a¨r va¨l korrelerad med den oo¨nskade variabeln samt att den inte ¨ar korrelerad med feltermen.
3.16.2 Durbin-Wu-Hausmann test
Det finns flera tillv¨agag˚angssa¨tt for att identifiera endogenitet i en modell. Fo¨r att unders¨oka om en eller flera av kovariaten i en given modell a¨r endogen kan man applicera Durbin-Wu-Hausmanns test. Det inneb¨ar att man utfo¨r en OLS regression f¨or de endogena variablerna p˚a de instrumentella variablerna, regressionen ser ut som fo¨ljande:
x = Zα + u (14)
Da¨r uˆ fr˚an regressionen i ekvation (14) anva¨nds fo¨r en ny regression, i vilken man unders¨oker om uˆ ger n˚agot signifikant utslag p˚a resultatet. Detta go¨rs genom att man utf¨or en OLS-regression av uˆ med X. Ekvationen illustreras som fo¨ljande:
Y = Xβ + Υuˆ + e (15)
Testet f¨or eventuell signifikans hos feltermen uˆ utformas som ett hypotestest med fo¨ljande uppsta¨llning [9]:
H0 = Υˆ if tested variable is exogenous.
H1 Υˆ if tested variable is endogenous.
3.16.3 2-SLS
Na¨r det uppst˚ar endogenitet i en modell betyder det att minst en av kovariaten ar endogen, vilket inneba¨r att den endogena variabeln a¨r korrelerad med fel- termen. Den vanligaste ˚atg¨arden fo¨r att lo¨sa problemet a¨r att applicera 2-SLS (“Two Stage Least Square”). F¨orsta steget ¨ar att info¨ra instrumentella variabler
som kan ers¨atta den endogena variabel. De variabler som fr˚an bo¨rjan var exo- gena samt de nya variablerna som beskriver den endogena variabeln definieras i en ny matris Z. Om Z har fler kolumner ¨an X m˚aste X projiceras p˚a Z, vilket go¨rs genom fo¨ljande:
de:
Xˆ = Z(ZtZ)−1ZtX (16)
Normalekvationen beskrivs s˚aledes som:
Xˆeˆ = 0 (17)
Vilket g¨or att punktskattningen av β definieras som fo¨ljande:
βˆ = (XˆtX)−1XˆtY (18)
Vilket ger estimationen av Xxxxx’x robusta kovariansmatris fo¨ljande utseen-
coˆv(βˆ) = (XˆtX)−1XˆtD(eˆ2)Xˆ(XˆtX)−1 n
n − k − 1
(19)
3.17 Multikollinj¨aritet
Det finns tv˚a typer av multikollinja¨ritet, imperfekt multikollinja¨ritet och perfekt multikollinja¨ritet.
3.17.1 Imperfekt multikollinj¨aritet
Mulitkollinj¨aritet uppst˚ar d˚a estimeringen fr˚an OLS inte har n˚agon unik lo¨sning. Detta h¨ander ifall tv˚a eller flera av kovariaten a¨r linja¨rt beroende, vilket inneba¨r att man kan beskriva ett kovariat som en linja¨rkombination av en eller flera and- ra kovariat. F¨or att uppta¨cka multikollinja¨ritet observerar man de uppskatta- de standardavvikelserna f¨or regressionskoefficienterna. Om standardavvikelserna antar h¨oga v¨arden a¨r det troligt att multikollinja¨ritet existerar i modellen. Fo¨r att eliminera multikollinj¨ariteten tar man bort de linja¨rt beroende variablerna fr˚an modellen, vilka man identifierar fr˚an kovariatens respektive VIF-va¨rde.
3.17.2 Perfekt multikollinj¨aritet
Perfekt multikollinj¨aritet inneba¨r att tv˚a av de beskrivande variablerna a¨r helt korrelerade med varandra. Ett exempel p˚a detta a¨r om man genomfo¨r en regres- sion med en variabel f¨or m¨an och en variabel fo¨r kvinnor, da¨r de na¨mnda va- riablerna a¨r helt korrelerade med varandra, eftersom att man inte kan vara en kvinna och man p˚a samma g˚ang. Darmed finns det inte en unik lo¨sning och perfekt multikollinj¨aritet uppst˚ar. Fo¨r att identifiera detta underso¨ker man ko- variatens respektive VIF-va¨rde.
3.18 Variance Inflation Factor (VIF)
Multikollinj¨aritet kan uppta¨ckas genom att titta p˚a kovariatens VIF-va¨rden. VIF indikerar hur mycket st¨orre variansen ¨ar ja¨mfo¨rt med vad den skulle varit om kovariatet var helt okorrelerat med de andra. Om det finns en modell da¨r man misst¨anker att det f¨orekommer k multikollinj¨ar kovariat, bera¨kna d˚a k
VIF-va¨rden, en fo¨r varje Xi. Ko¨r sedan en vanlig OLS regression med Xi som responsvariabel p˚a de andra kovariaten, vilket kan definieras som fo¨ljande:
Xi = 1γ0 + γ1Xi+1 + γ2Xi+2 + γ3Xi+3 + γ4Xi+4 + ... + γkXi+k + ei
Ha¨r ¨ar i = 1, 2, ..., k VIF-va¨rdet bera¨knas genom fo¨ljande:
i
V IF (βˆ ) = 1
(20)
i
1 − R2
En tumregel vid bed¨omning av resultatet fr˚an ekvation (20) a¨r att VIF-va¨rde
> 10 indikerar ho¨g multikollinja¨ritet [16].
4 Unders¨okning och behandling av dataset och modell
4.1 Fo¨rklaring av kovariat
I det givna datasetet som erh¨olls fr˚an Wiget Media ˚aterfanns sju variabler, na¨mligen V iewers, Price, plattform, OS, land, tid och kategori. Av dessa va- riabler var det endast Xxxxx och V iewers som var kvantifierbara, vilket in- neba¨r att de fem ˚aterst˚aenda variablerna erho¨lls som stra¨ngar. Fo¨r att kunna genomfo¨ra en regressionsanalys p˚a den givna datan delades kovariaten upp i dummyvariabler, vilket resulterade i en grundmodell best˚aendes av 38 variab- ler.
4.1.1 V iewers
V iewers ¨ar ett kovariat som beskriver hur m˚anga visningar en viss annons har f˚att under en given period. Antalet V iewers a¨r kopplat till en datapunkt och ho¨r ihop med de resterade sex kovariaten Price, plattform, OS, land, tid och kategori fo¨r den givna datapunkten.
4.1.2 Price
Price ¨ar en variabel som st˚ar for det faktiska va¨rdet som annonsen s˚aldes fo¨r. I datasetet var Xxxxx givet i CPM, vilket betyder att det illustrerade priset a¨r priset fo¨r 1000 visningar i dollar.
4.1.3 Plattform
Plattform a¨r ett kovariat som beskriver vilken typ av plattform en anva¨ndare befinner sig p˚a n¨ar denne ser en annons. Plattform angavs som Desktop eller Mobile. Kovariatet delades da¨rf¨or upp i tv˚a dummyvariabler fo¨r att kunna go¨ra en regressionsanalys. I dummyvariabeln Desktop r¨aknas stationa¨ra datorer samt ba¨rbara datorer. Till Mobile raknas mobiler och andra ta¨nkbara uppkopplade enheter som inte ing˚ar i Desktop.
4.1.4 OS
OS a¨r ett kovariat som beskriver vilken typ av operativsystem som annonsen visats p˚a. OS ¨ar det kovariat som beskriver om annonsen visats p˚a exempelvis Windows7, Windows8, Mac, iPhone eller Android. Kovariatet OS anges i termer av namn vilket inneb¨ar att OS delades upp i ett antal kovariat som beskriver varje enskild plattform.
4.1.5 Land
Kovariatet land beskriver vilket land som annonsen visats i. Kovariatet land var uppdelad i sju l¨ander i Europa och Norden. Fo¨r att genomfo¨ra regressionen delades kovariatet land upp i sju stycken dummyvariabler.
4.1.6 Tid
Tid a¨r det kovariat som beskriver na¨r p˚a dygnet annonsen visats. Tid delaades in i fyra dummyvariabler som var och en motsvarar ett av fyra tidsintervall. TimeInter1 beskriver tiden fr˚an 00:00 till 05:00, TimeInter2 beskriver tiden fr˚an 05:00 till 11:00, TimeInter3 beskriver tiden mellan 11:00 och 17:00, TimeInter4 beskriver tiden fr˚an 17:00 till 24:00. Anledningen till att dummyvariablerna kategoriserats som ovan ¨ar p˚a grund av att trafiken som varje dummyvariabel beskriver ¨ar ungef¨ar lika inom tidsintervallet, men trafiken skiljer sig mellan de olika dummyariablerna.
4.1.7 Kategori
Kovariatet kategori beskriver vilken typ av sajt som annonsen visats p˚a. Ko- variatet bestod av 17 olika kategorier av sajter, vilket inneba¨r att 17 dummy- variabler skapades f¨or att regressionsanalys p˚a datan skulle kunna genomfo¨ras. Vissa av dummyvariablerna som skapades ¨ar uppbyggda av flera kategorier vil- ket f¨orklaras med att man i den givna datan inte kunde utro¨na vilken av alla kategorier som var kopplat till sajten da¨r annonsen visades.
4.2 Test av heteroskedasticitet
Fo¨r att v¨alja vilken modell som a¨r mest la¨mplig att anva¨nda med avseende
p˚a datan beh¨ovs en underso¨kning av datan utfo¨ras. Det a¨r viktigt att un-
derso¨ka om datan a¨r homoskedastisk eller heteroskedastisk. I teoriavsnittet a¨r ett tillv¨agag˚angss¨att fo¨r detta beskrivet, vilket a¨r att man underso¨ker datan ge- nom att plotta feltermerna eˆ mot responsvariabeln Y . I figur 3 ˚aterfinns plotten av feltermerna mot responsvariabeln som i det ha¨r fallet a¨r priset av annonserna.
Figur 3: Grundmodell
I figur 3 ser man ¨aven tydliga heteroskedastiska tendenser i datan eftersom variansen inte ¨ar konstant. For att faststa¨lla att datan a¨r heteroskedastisk ge- nomfo¨rs ett Berusch-Pagan test med fo¨ljande resultat:
Tabell 1: Breusch-Pagan test F-va¨rde df p.value
431.73 35 2.2*10−16
i
I tabell 1 ser man att testet genererade p-v¨ardet < 2.2 ∗ 10−16. D˚a hypotesen fo¨r testet ¨ar att datan a¨r homoskedastisk forkastas antagandet och det konsta- teras att heteroskedasticitet ¨ar n¨arvarande. P˚a grund av detta valdes en modell fo¨r att handskas med heteroskedasticitet. I sja¨lva regressionen anva¨nds log p˚a responsvariabeln, som definieras enligt log(1+Price). I mjukvaruprogrammet som utf¨or regressionen anva¨ndes a¨ven en robust summering (robust.summary) av regressionen p˚a log(1 + Price) som responsvariabel, vilket genererar resul- tat i form av estimerade βi-va¨rden, feltermer (ei), p˚averkningsgrad (η2) samt p-va¨rden f¨or respektive kovariat. Testet behandlar eventuell heteroskedastici- tet och resultaten fr˚an dessa k¨orningar anses da¨rfo¨r vara validerade fo¨r att dra eventuella slutsatser.
Figur 4: log-modell
I figur 4 ses feltermerna fr˚an regressionen p˚a log(1 + Price) plottade mot Price. Efter ¨andringen i modellen kan man se att heteroskedasticitet fortfarande a¨r na¨rvarande, men i mindre utstra¨ckning a¨n innan.
4.3 Uppst¨allning av modell
D˚a heteroskedasticitet har indentifierats i datan sta¨lls en modell upp fo¨r att handskas med detta. I regressionen ˚aterfinns responsvariabeln log(1+Price) som
predikteras med hj¨alp av kovariatet viewers och dummyvariablerna som beskri- ver de resterande variablerna. Det inneb¨ar att grundmodellen sta¨lls upp som fo¨ljande:
log(1+Price) = β0 + β1X1 + β2X2 + ... + β38X38 + ei, dar i = 1, 2, ..., 38
Kovariaten som inkluderas i grundmodellen ˚aterfinns i Appendix 11.1, da¨r variablerna Windows7, desktop, TimeInter4, CSE, catDownloadSites a¨r bench- marks i den redovisade regressionen.
4.4 Reducering av modell
Fo¨r att reducera ursprungsmodellen anva¨ndes AIC fo¨r att bedo¨ma om enskilda variabler kan elimineras ur modellen. F¨or val av kovariat att testa valdes de ko- variat med h¨ogre p-v¨arde, l˚ag p˚averkningsgrad eller en kombination av de b˚ada. Ett AIC test utf¨ordes efter varje eliminerat kovariat fo¨r att underso¨ka skillnaden mellan modellen med det testade kovariatet samt modellen utan kovariatet. Ett la¨gre AIC-v¨arde indikerar p˚a en fo¨rba¨ttrad modell, da¨rfo¨r gjordes tester fo¨r att ta fram den optimala modellen givet datasetet.
Fo¨rst utf¨ordes ett test p˚a kovariatet CAT d¨ar b˚ade P-va¨rdet var ho¨gt samt η2-v¨arde som var f¨orh˚allandevis l˚agt. Modellen utan kovariatet resulterade i ett l¨agre AIC va¨rde och darf¨or togs CAT bort fr˚an modellen. Den reducerade modellen utv¨arderades d¨arefter utan kovariatet catLinkShortener. Modellen gav ett lagre AIC-v¨arde ¨an modellen med kovariatet och plockades da¨rf¨or bort fr˚an modellen. Vidare unders¨oktes kovariatet CDE d˚a detta kovariat var ett av de kvarvarande kovariaten som hade h¨ogt p-varde samtidigt som η2-va¨rdet var l˚agt. AIC-va¨rdet fo¨r den reducerade modellen utan kovariatet CDE genererade a¨ven det ett l¨agre AIC-v¨arde och eliminerades da¨rfo¨r ifr˚an modellen. Vidare testades kovariatet catDownloadSitesAdultContent f¨or ett ho¨gre AIC-va¨rde och beho¨lls da¨rf¨or i modellen. Kopplat till modellerna har a¨ven ett R2-va¨rde tagits fram vilket beskriver hur v¨al anpassad modellen a¨r till den givna datan. Model4 a¨r den slutgiltiga modellen som anv¨ands fo¨r resterande tester. Nedan visas en tabell av resultaten fr˚an k¨orningarna. I Appendix (11.1-11.4) ˚aterfinns alla kovariat som inkluderades i de olika AIC-ko¨rningarna.
Model1 | Model2 | Model3 | Model4 | Model5 |
AIC -1267.5765 | -1269.5753 | -1269.7300 | -1270.5246 | -1270.3553 |
Tabell 2: AIC ko¨rningar
R2 0.7606 0.7606 0.7604 0.7603 0.7600
4.5 Underso¨kning av multikollinj¨aritet genom VIF-test
Fo¨r att underso¨ka om modellen inneh˚aller multikollinja¨ra variabler genomfo¨rs ett VIF-test d¨ar resultatet fr˚an testet illustreras nedan. Vilket tidigare na¨mnts i teoriavsnittet indikerar ett VIF-va¨rde > 10 p˚a multikollinja¨ritet.
Tabell 3: VIF-tabell
VIFtable
Viewers | 37.49 |
CDK | 1.18 |
CES | 1.33 |
CFR | 1.80 |
CIT | 1.88 |
PFMobile | 8.12 |
OSAndroid | 4.96 |
OSIpad | 3.59 |
OSIphone | 4.01 |
OSMac | 1.32 |
OSUnix | 1.18 |
OSWindows | 1.50 |
OSWindows8 | 1.38 |
OSWindowsVista | 1.11 |
OSWindowsXP | 1.10 |
catAppsandExtensions | 2.52 |
‘catDownloadSites,AdultContent‘ | 1.02 |
‘catDownloadSites,TVandMovies‘ | 1.22 |
catExchangeTier2 | 1.95 |
catFileHosting | 3.64 |
catImageHosting | 1.07 |
‘catImageHosting,AdultContent‘ | 1.02 |
catOther | 3.65 |
catSportStreaming | 1.24 |
‘catSport,SportStreaming‘ | 1.05 |
catTVandMovies | 1.57 |
‘catTVandMovies,FileHosting‘ | 2.54 |
‘catTVandMovies,Sport‘ | 1.04 |
‘catTVandMovies,Sport,FileHosting,SportStreaming‘ | 1.10 |
‘catTVandMovies,Sport,SportStreaming‘ | 1.23 |
TimeInter1 | 1.16 |
TimeInter2 | 1.23 |
TimeInter3 | 1.21 |
log(Viewers) | 9.44 |
Viewers.sqr | 17.65 |
I tabell 3 kan man utl¨asa att det endast a¨r tv˚a va¨rden som a¨r > 10, ett av dem ¨ar V iewers. Anledningen till att ho¨g multikollinja¨ritet ˚aterfinns hos det kovariatet ¨ar f¨or att det kan beskrivas v¨al av kovariaten log(V iewers) och V iewers.sqr. Detta ¨ar inte ett problem i modellen d˚a endast en underso¨kning av variablers p˚averkan g¨ors och inte en prediktion av priset. Detsamma ga¨ller fo¨r V iewers.sqr.
4.6 QQ-plot
En QQ-plot har gjorts f¨or att underso¨ka om residualerna a¨r normalfo¨rdelade eller ej. Enligt figur 5 syns tendenser p˚a att residualerna inte a¨r det. ˚Atga¨rder
har gjorts f¨or att motverka detta, dels genom att logaritmera responsvariabeln men a¨ven addition av log(V iewers) samt V iewers.sqr i modellen.
Figur 5: QQ-plot
Vidare alternativa ˚atg¨arder har underso¨kts, exempelvis genom att la¨gga till en variabel i datan. Detta har dock inte varit mo¨jligt vilket gjort att fo¨ljande utseende har accepteras.
4.7 Endogenitet
Kovariat som misst¨anks vara endogena behover underso¨kas na¨rmre fo¨r att ute- sluta eller bekr¨afta endogenitet. Man kan ta¨nka sig att plattform a¨r en endogen variabel, men d˚a variabeln endast a¨r uppdelad i dummies beho¨vs dummyva- riablerna unders¨okas fo¨r eventuell endogenitet. En plott fo¨r dummyvariabeln Desktop visas nedan f¨or att underso¨ka eventuell endogenitet.
Figur 6: Endogenitetstest Platform
I figur 6 ses plotten f¨or variabeln plattform som a¨r uppdelad i tv˚a kovariat, Desktop och Mobile. N¨ar Desktop a¨r aktiv resulterar dummyvariabeln i en etta och felet tillh¨orande Desktop a¨r allts˚a plottad kring va¨rdet 1 p˚a x-axeln. Na¨r det inte ¨ar en Desktop ¨ar va¨rdet noll och felet fo¨r detta a¨r plottat p˚a x-axeln kring va¨rdet 0. Medelfelet f¨or Desktop a¨r 0.05 och mobile a¨r 0.03. Eftersom medelfelet ar ungefa¨r samma f¨or b˚ade Desktop och Mobile samt att plotten visar p˚a att variansen f¨or feltermerna a¨r f¨orh˚allandevis lika, kan man dra slutsatsen att det inte r˚ader n˚agon endogenitet hos kovariatet plattform.
Vidare misst¨anks V iewers vara endogen. Ytterligare en plott har utfo¨rts fo¨r att unders¨oka detta n¨armare. I figur 7 visas V iewers mot residualerna.
Figur 7: Endogenitetstest Viewers
I figur 7 kan man se att endogenitet inte a¨r na¨rvarande eftersom regressions- linjen a¨r utan lutning genom punkterna. Detta g¨or att V iewers utesluts som endogen.
5 Resultat
5.1 Regressionens koefficienter
Fr˚an avsnittet reducering av modell togs den slutgiltiga modellen fram och pre- senteras i avsnitt 11.1. Modellen har sedan anv¨ands i fo¨ljande ko¨rningar fo¨r att ber¨akna kovariatens estimat och konfidensintervall. Vid bera¨kning av kon- fidensintervall gjordes test p˚a 5% signifikansniv˚a med tillho¨rande Bonferronis korrektion. D¨ar ber¨akningen korrigeras efter antalet kovariat i modellen. I detta fall har 35 kovariat inkluderats, vilket var antalet kovariat som var kvar efter reducering.
5.1.1 P˚averkan fr˚an viewers
V iewers har den st¨orsta p˚averkan p˚a modellen. Detta a¨r rimligt ur ett mark- nadsperspektiv, d˚a annonsorer a¨r beredda att betala mer na¨r efterfr˚agan a¨r stor. Varje enskild Viewer har l˚ag p˚averkan p˚a slutpriset, da¨remot skiljer sig antalet viewers p˚a varje annons stort och str¨acker sig fr˚an ett f˚atal till ca 20000.
Tabell 4: Konf. intervall viewers
lower upper
Viewers | 0.0001 | 0.0001 |
log(Viewers) | 0.1269 | 0.2066 |
Viewers.sqr | -0.0000 | -0.0000 |
V iewers har en relativt stor p˚averkan p˚a modellen. Med en av de ho¨gsta η2-v¨ardena och med l˚agt p-va¨rde g˚ar det inte att ifr˚agasa¨tta kovariatets existens i modellen.
Tabell 5: P˚averkningsgrad viewers
Std.Error | Eta.sq | p.value | |
Viewers | 0.0000 | 0.0510 | 0.0000 |
log(Viewers) | 0.0124 | 0.0912 | 0.0000 |
Viewers.sqr | 0.0000 | 0.0138 | 0.0000 |
5.1.2 P˚averkan fr˚an l¨ander
I tabell 6 presenteras konfidensintervallen f¨or la¨ndernas kovariat. Med Bonfer- roni korrigeringen kan man dra slutsatser om p˚averkan fr˚an flera av kovariaten. Landet som benchmarkas i regressionen a¨r Sverige, O¨ sterrike och Tyskland.
I kontrast till benchmarken ses i tabell 6 att inga la¨nder har en positiv p˚averkan p˚a priset. Danmark, Spanien, Frankrike och Italien ger alla ett negativt utslag p˚a priset, d¨ar man kan dra slutsatsen att Spanien a¨r det land som har sto¨rst negativ inverkan p˚a priset sett till alla l¨ander. Bland de la¨nder som ses i tabell 6 kan man ¨aven dra slutsatsen att Frankrike ger ett positivt utslag p˚a priset kontra Danmark och Spanien.
Tabell 6: Konf. intervall la¨nder
lower upper
CDK | -0.3028 | -0.1721 |
CES | -0.8013 | -0.6366 |
CFR | -0.1244 | -0.0362 |
CIT | -0.2036 | -0.0960 |
Vidare a¨r det intressant att unders¨oka kovariatens p˚averkningsgrad p˚a priset. I tabell 7 ˚aterfinns respektive kovariats p˚averkningsgrad η2. Spanien har sto¨rsta p˚averkan p˚a slutpriset, vilket man kan se genom att studera konfidensintervallen i tabell 6. F¨or prissa¨ttningen av annonser spelar la¨nder roll p˚a slutpriset och det a¨r n˚agot som man bo¨r ta ha¨nsyn till.
Tabell 7: P˚averkningsgrad la¨nder Std.Error η2 p.value
CDK | 0.0204 | 0.0151 | 0.0000 |
CES | 0.0257 | 0.4083 | 0.0000 |
CFR | 0.0138 | 0.0247 | 0.0000 |
CIT | 0.0168 | 0.0332 | 0.0000 |
Det a¨r relevant att utreda kovariatens P-va¨rde fo¨r att kunna besta¨mma deras relevans i modellen. Ovan ser man att samtliga kovariat har l˚aga η2-va¨rden utom Spanien.
5.1.3 P˚averkan fr˚an plattform
Plattformarna j¨amfo¨rs mellan varandra, d¨ar PFMobile benchmarkas mot PF- Desktop. I tabell 8 kan man urskilja att PFMobile a¨r att fo¨redra vid prissa¨ttning och har ett generellt ho¨gre pris.
Tabell 8: Konf. intervall plattform
lower upper PFMobile 0.2313 0.3995
PFMobiles p˚averkningsgrad ¨ar inte avvikande stor eller l˚ag och p-va¨rdet tillra¨ckligt signifikant f¨or att vara relevant i modellen.
Tabell 9: P˚averkningsgrad plattform
Std.Error η2 p.value PFMobile 0.0262 0.0727 0.0000
5.1.4 P˚averkan fr˚an OS
Operativsystemen benchmarkades mot OSWindows7. Fo¨r de olika operativsy- stemen kan man konstatera att alla kovariat har ett negativt utslag p˚a slutpriset, da¨remot m˚aste man ta¨nka p˚a att OSAndroid, OSIpad, OSIphone tillho¨r PFMo- bile och f˚ar ett negativt estimat men va¨gs upp av det positiva estimatet hos PFMobile.
Tabell 10: Konf. intervall OS
lower | upper | |
OSAndroid | -0.2592 | -0.1179 |
OSIpad | -0.5248 | -0.3262 |
OSIphone | -0.4273 | -0.2530 |
OSMac | -0.1168 | -0.0172 |
OSUnix | -0.2025 | -0.1152 |
OSWindows | -0.0863 | -0.0016 |
OSWindows8 | -0.0927 | -0.0033 |
OSWindowsVista | -0.2301 | -0.1075 |
OSWindowsXP | -0.2010 | -0.0992 |
I tabell 11 ser man att resultaten f¨or respektive kovariats η2 a¨r relativt l˚aga och inget kovariat utm¨arker sig som avvikande i η2. Tabellen inneh˚aller inte n˚agot avvikande p-va¨rde.
Tabell 11: P˚averkningsgrad OS
Std.Error η2 p.value
OSAndroid | 0.0220 | 0.0311 | 0.0000 |
OSIpad | 0.0310 | 0.0864 | 0.0000 |
OSIphone | 0.0272 | 0.0595 | 0.0000 |
OSMac | 0.0156 | 0.0089 | 0.0000 |
OSUnix | 0.0136 | 0.0250 | 0.0000 |
OSWindows | 0.0132 | 0.0065 | 0.0010 |
OSWindows8 | 0.0139 | 0.0061 | 0.0006 |
OSWindowsVista | 0.0191 | 0.0187 | 0.0000 |
OSWindowsXP | 0.0159 | 0.0127 | 0.0000 |
5.1.5 P˚averkan fr˚an tiden
I tabell 12 illustreras tidens p˚averkan p˚a priset. Tiden a¨r uppdelad i 4 intervall som tidigare n¨amnts och fo¨rklarats i rapporten. TimeInter1 a¨r fr˚an midnatt till morgon, TimeInter2 ¨ar morgon till fo¨rmiddag, TimeInter3 a¨r fo¨rmiddag till eftermiddag och TimeInter4 ¨ar eftermiddag till natt. De tre intervallen som redovisas i figuren benchmarkas mot TimeInter4. Eftersom konfidensintervallen fo¨r endast Timeinter1 a¨r negativ ¨ar slutsatsen att detta tidsintervall har en negativ p˚averkan p˚a slutpriset sett till benchmarken. Man kan vid ja¨mfo¨relse av kovariaten emellan inte dra n˚agon slutsats om skillnaderna internt.
Tabell 12: Konf. intervall tiden
lower upper
TimeInter1 | -0.1201 | -0.0392 |
TimeInter2 | -0.0627 | 0.0169 |
TimeInter3 | -0.0446 | 0.0153 |
Resultatet fr˚an k¨orningen av regressionen visas nedan. Vad man kan se a¨r att p-v¨ardena fo¨r TimeInter1 och TimeInter2 a¨r na¨ra 0 medan effektstorleken fo¨r de b˚ada ¨ar va¨ldigt l˚ag. Medan TimeInter3 har en ett relativt ho¨gt p-va¨rde
Tabell 13: P˚averkan tiden
Std.Error Eta.sq p.value
TimeInter1 | 0.0126 | 0.0137 | 0.0000 |
TimeInter2 | 0.0124 | 0.0017 | 0.0701 |
TimeInter3 | 0.0094 | 0.0012 | 0.1267 |
5.1.6 P˚averkan fr˚an kategorierna
Nedan visas resultaten f¨or kategorierna fr˚an regressionen. Benchamerken fo¨r regressionen a¨r catDownloadSites och catLinkShortener. Vid underso¨kning av konfidensintervallen ser man att det inte finns n˚agra kategorier som har posi- tivt utslag mot benchmarken. Alla kategorier har ett negativt utslag p˚a priset ja¨mfo¨rt med benchmarken. Dock kan man underso¨ka konfidensintervallen fo¨r kovariaten i tabell 14. Vad man ser a¨r exempelvis att kategorin catAppsandEx- tensions ger ett positivt utslag p˚a priset ja¨mfo¨rt med kategorin catImageHosting, detta eftersom det ¨ovre konfidensintervallet fo¨r catImageHosting a¨r la¨gre a¨n det la¨gre konfidensintervallet fo¨r kategorin catAppsandExtensions. Underso¨ker man resultaten a¨n mer noga ser man att kategorin som ger sa¨mst utslag p˚a priset a¨r kategorin ”catTVandMoviesSportFileHostingSportStreaming”.
Tabell 14: Konf. intervall kategorier | ||
lower | upper | |
catAppsandExtensions | -0.2408 | -0.1082 |
‘catDownloadSites,AdultContent‘ | -0.3350 | -0.1755 |
‘catDownloadSites,TVandMovies‘ | -0.4346 | -0.3074 |
catExchangeTier2 | -0.4507 | -0.3278 |
catFileHosting | -0.3811 | -0.2729 |
catImageHosting | -0.5037 | -0.2648 |
‘catImageHosting,AdultContent‘ | -0.4770 | -0.3112 |
catOther | -0.1787 | -0.0761 |
catSportStreaming | -0.3350 | -0.1641 |
‘catSport,SportStreaming‘ | -0.4909 | -0.3518 |
catTVandMovies | -0.4062 | -0.2321 |
‘catTVandMovies,FileHosting‘ | -0.4012 | -0.2810 |
‘catTVandMovies,Sport‘ | -0.4929 | -0.3448 |
‘catTVandMovies,Sport,FileHosting,SportStreaming‘ | -0.9972 | -0.8136 |
‘catTVandMovies,Sport,SportStreaming‘ | -0.4899 | -0.3409 |
− −
Kopplat till konfidensintervallet f¨or kategorierna ˚aterfinns nedanst˚aende ta- bell fr˚an regressionen. Vad man ser ¨ar att vissa kategorier har ett l˚agt η2-va¨rde samt ett l˚agt p va¨rde. L˚aga p va¨rden a¨r v¨antat eftersom AIC har reduce- rat modellen och tagit bort kovariaten som inte ska vara med. Studerar man η2 fr˚an tabell 15 ser man att v¨ardena fo¨r vissa kovariat a¨r ho¨ga. Framfo¨rallt catExchangeTier2, catFileHosting och catTvandMovies.
Tabell 15: P˚averkan kategorier
Std.Error η2 p.value
catAppsandExtensions | 0.0208 | 0.0367 | 0.0000 |
‘catDownloadSites,TVandMovies‘ | 0.0199 | 0.0405 | 0.0000 |
catExchangeTier2 | 0.0192 | 0.1482 | 0.0000 |
catFileHosting | 0.0170 | 0.1509 | 0.0000 |
catImageHosting | 0.0372 | 0.0162 | 0.0000 |
‘catImageHosting,AdultContent‘ | 0.0259 | 0.0052 | 0.0000 |
catOther | 0.0160 | 0.0293 | 0.0000 |
catSportStreaming | 0.0267 | 0.0223 | 0.0000 |
‘catSport,SportStreaming‘ | 0.0217 | 0.0115 | 0.0000 |
catTVandMovies | 0.0272 | 0.0645 | 0.0000 |
‘catTVandMovies,FileHosting‘ | 0.0188 | 0.1258 | 0.0000 |
‘catTVandMovies,Sport‘ | 0.0231 | 0.0114 | 0.0000 |
‘catTVandMovies,Sport,FileHosting,SportStreaming‘ | 0.0286 | 0.1035 | 0.0000 |
‘catTVandMovies,Sport,SportStreaming‘ | 0.0233 | 0.0520 | 0.0000 |
6 Diskussion
I resultatavsnittet kan man tydligt se att kovariaten p˚averkar det slutliga pri- set p˚a olika s¨att. I det ha¨r avsnittet diskuteras kovariaten var fo¨r sig och som ja¨mf¨orelser mellan varandra. A¨ ven modelluppst¨allningen och tillva¨gag˚angssa¨ttet
kommenteras samt f¨orslag till alternativa tillva¨gag˚angssa¨tt.
6.1 Kovariat
De kovariat som anv¨ands i regressionsmodellen presenteras och kommenteras nedan.
6.1.1 Viewers
Viewers har som fo¨rv¨antat den st¨orsta p˚averkan p˚a slutpriset av annonserna. Problemet f¨or WigetMedia ¨ar sv˚arigheter i att p˚averka hur m˚anga Viewers de f˚ar d˚a antalet fr¨amst a¨r beroende av trafiken hos sidan de ma¨klar till. Da¨remot bo¨r man inse vikten av att ko¨pa ra¨ttigheter att ma¨kla till sidor som har en ho¨g trafik f¨or att kunna generera sto¨rsta mo¨jliga inta¨kter. Dessutom blir det an viktigare att m¨akla r¨att annonser till r¨att sida fo¨r att kunna ta ut ho¨gsta mo¨jliga pris.
6.1.2 Plattform
Sto¨rre delen av de observerade datapunkterna utgjordes av annonser som s˚aldes via dator. I datan framgick det inte om det var en stationa¨r eller ba¨rbar dator som annonsen s˚aldes p˚a. Det ¨ar m¨ojligt att det kan finnas en skillnad i pris p˚a annonser som s¨aljs via en stationa¨r dator och en ba¨rbar dator, men det a¨r inget som den h¨ar rapporten kan besvara sett till urvalet av data.
Vid j¨amf¨orelse av annonsering p˚a plattformarna mobiltelefoner och datorer, identifierades en tydlig skillnad. Mobilmarknaden har i genomsnitt ett ho¨gre pris p˚a annonser ¨an de som annonseras p˚a datorer. Detta beror fra¨mst p˚a att priset p˚a annonserna inom datormarknaden skiljer sig stort mellan vilken typ av operativsystem som anv¨ands, medan den mobila marknaden har en homogen prissa¨ttning mellan operativsystemen. Vilken plattform som annonso¨rerna va¨ljer att annonsera p˚a ¨ar avg¨orande fo¨r slutpriset, da¨remot finns det fler bakomliggan- de orsaker kopplade till detta kovariat som har en sto¨rre betydelse fo¨r slutpriset.
6.1.3 Operativsystem (OS)
Operativsystemen har en stor p˚averkan p˚a slutpriset, da¨r det a¨r en stor sprid- ning mellan de positiva och negativa p˚aslagen enligt tabell 10. Det fra¨msta operativsystemet a¨r OSWindows7, detta ka¨nns troligt eftersom det a¨r det klart vanligaste. Da¨rf¨or blir det lattare att ta fram en standardiserad modell anpassad efter dessa operativsystem tillskillnad fr˚an ¨ovriga. Man bo¨r a¨ven ta ha¨nsyn till operativsystemens interaktionseffekt med plattformar och hur man kan va¨lja att kategorisera in de mobila plattformarna OSAndroid, OSIphone och OSI- pad och f˚a ett generellt h¨ogre pris inom hela det segmentet, medan de o¨vriga operativsystemen fo¨rutom OSWindows7 med tillho¨rande datorer ger ett sa¨mre slutpris.
Det finns en tydlig p˚averkan fr˚an operativsystemen men det viktiga a¨r hur man v¨aljer att dela upp sitt segment. Va¨ljer man att sa¨lja annonser p˚a dator- marknaden hamnar stor vikt p˚a att rikta sig till det specifika operativsystemet OSWindows7, medan vid inriktning mot mobilmarknaden har operativsystemet inte lika stor betydelse och marknaden i stort blir mer intressant.
6.1.4 Kategori
De flesta datapunkterna tillho¨rde endast en kategori. De datapunkter som in- neho¨ll fler a¨n en kategori d¨optes till det fulla namnet av samtliga kategorier som kopplades till datapunkten. Eftersom det ur datan inte gick att avgo¨ra vilken ka- tegori av alla som listades till datapunkten valdes det na¨mnda tillva¨gag˚angssa¨ttet.
Valet av kategori att annonsera inom kan ha stor p˚averkan p˚a priset d˚a fler- talet av kategorierna ger stort utslag, de flesta a¨ven ett negativt utslag p˚a priset sett till benchmarken som anv¨ands i regressionen. Man m˚aste a¨ven ha i ˚atanke att antalet dummy-variabler inom detta omr˚ade blev va¨ldigt m˚anga. Ma¨ngden kovariat sprider ut den totala p˚averkan p˚a varje individuellt kovariat. Da¨rfo¨r har detta omr˚ade en mycket sto¨rre effekt p˚a slutpriset ¨an vad varje enskilt ko- variat ger upphov till. Det ¨ar snarare det aggregerade p˚averkningsgraden fr˚an alla kovariat tillsammans som ger en fingervisning av kovariatets p˚averkan p˚a slutpriset. Da¨rf¨or anses kategorierna ha den na¨st sto¨rsta p˚averkan p˚a slutpriset. Fo¨r att kunna uppn˚a ba¨ttre resultat fo¨r kategorierna kra¨vs en mer precis indel- ning av kategorierna f¨or att minska antalet kovariat fo¨r att i sin tur kunna dra ba¨ttre slutsatser.
6.1.5 Land
Ser man till l¨ander finns det ett antal la¨nder som a¨r intressanta att diskutera. Wiget Media trodde p˚a f¨orhand att den marknaden som p˚averkar priset mest i positiv bem¨arkelse skulle vara Sverige. I tabell 6, da¨r benchmarken a¨r Sverige, O¨ sterrike och Tyskland ser man tydligt att detta sta¨mmer o¨verlag och ger ett positivt utslag p˚a priset. Spanien har den st¨orst p˚averkningsgrad och mest ne- gativ j¨amf¨ort med de o¨vriga la¨nderna. Detta g¨or att la¨nder har en stor p˚averkan och a¨r en viktigt faktor fo¨r slutpriset.
6.1.6 Tid
Tidens p˚averkan p˚a priset var f¨orv˚anansv¨art l˚ag mot vad som fo¨rutsp˚addes. Detta kan bero p˚a att kovariatet V iewers hade en stor p˚averkan samt att ti- den och V iewers ¨ar relativt korrelerade (se avsnitt 8.10, figur 10). Da¨rfo¨r blir p˚averkan fr˚an tiden mindre ¨an vad den fo¨rva¨ntas. Man kan diskutera relevansen av att tiden finns med i modellen men i och med att testerna visar att den bo¨r beh˚allas har den inte tagits bort.
Tidsintervallen i modellen visar alla ett negativt utslag i fo¨rh˚allande till Ti- meInter3 och TimeInter4 vilka anger tiden mellan 11:00-17:00 respektive 17:00- 24:00. Eftersom andelen V iewers ¨ar sto¨rst inom detta intervall kan detta ligga till grund till att den f˚ar st¨orst positiv p˚averkan p˚a slutpriset. TimeInter1 har den st¨orsta negativa p˚averkan och intervallet befinner sig i omr˚adet da¨r andelen V iewers a¨r la¨gst.
7 Slutsats
Slutsatsen som kan dras givet datan som erh¨olls ¨ar att olika kovariat har olika stor p˚averkan p˚a slutpriset. Med en fo¨rklaringsgrad om 76% anses resultaten fr˚an regressionen vara tillr¨ackligt goda for att agera som underlag fo¨r att kunna dra slutsatser av resultaten. Genom att j¨amf¨ora de olika kovariaten kan man dra slut- satsen att V iewers har den ¨overla¨gset sto¨rsta fo¨rklaringsgraden samt p˚averkan p˚a slutpriset. D¨aremot a¨r denna faktor inget f¨oretaget direkt kan p˚averka och da¨rmed irrelevant att underso¨ka mer utf¨orligt. Det kovariat som har na¨st sto¨rst p˚averkan p˚a priset ¨ar kategorierna, d¨ar olika kategorier p˚averkar slutpriset olika mycket. Det kan da¨rf¨or vara av stor vikt fo¨r Wiget Media att analysera den ha¨r informationen f¨or framtida f¨orsa¨ljningar och uppk¨op av ra¨ttigheter att ma¨kla trafik.
Fr˚an resultatet av regressionen kan man sa¨ga att Sverige a¨r ett av de un- derso¨kta la¨nderna som p˚averkar priset mest i positiv bema¨rkelse, vilket var Wi- get Medias hypotes. Resultatet visar p˚a att de lo¨nsammaste la¨nderna att annon- sera i ¨ar Tyskland, O¨ sterrike och Sverige samtidigt som Spanien har en stor ne- gativ p˚averkan p˚a slutpriset. Denna slutsats dras d˚a dessa la¨nder ger de sto¨rsta utslagen p˚a priset samt att l¨anderna har fo¨rh˚allandevis stor p˚averkningsgrad ja¨mfo¨rt med de andra la¨nderna. Den ha¨r informationen kan komma va¨l till- hands fo¨r Wiget Media nar det ga¨ller expansion p˚a marknader.
Att annonsera via mobila enheter kontra dator ger a¨ven det ett positivt ut- slag p˚a slutpriset. Det inneb¨ar att det a¨r mer gynnsamt att annonsera inom det segmentet. Noterbart ¨ar dock att inom segmentet fo¨r datorer a¨r Windows 7 l¨onsammare a¨n ¨ovriga kombinationer av operativsystem och plattform. Det vill s¨aga att det mest lo¨nsamma for Wiget Media a¨r att annonsera p˚a operativ- system med Windows 7, men om man bara skulle rikta sig till den marknaden blir kundsegmentet v¨al skralt, vilket gor att man bo¨r annonserar p˚a andra ope- rativsystem d˚a dessa fortfarande a¨r lo¨nsamma fo¨r fo¨retaget.
Det kovariat som har minst utslag p˚a slutpriset a¨r tiden, vilket inneba¨r att det teoretiskt sett inte spelar n˚agon roll na¨r p˚a dygnet man annonserar. Da¨remot ar trafiken som m¨aklas under dygnet varierande och kvalit´en p˚a V iewers va- rierar. Priset per annons ger da¨rfo¨r inte s˚a stort utslag men kombinerar man antalet V iewers med priset p˚a annonserna blir omsa¨ttningen mycket ho¨gre un- der kv¨allstid vilket i praktiken inneba¨r att tiden spelar stor roll.
8 Priss¨attningsstrategi for m¨aklare p˚a internet
8.1 Introduktion
Annonsering p˚a internet b¨orjade redan 1994 na¨r internetmagasinet HotWire s˚alde en banner ad till f¨oretaget [11]. Sedan starten upplevde annonsmark- naden p˚a internet en stagnation i tillva¨xten fram till och med IT-bubblan 2000. Efter att IT-bubblan sparck tog marknaden fart och en ny generation IT-bolag v¨axte fram. Denna nya generation ¨aven kallad “Web 2.0” hade en ny affa¨rsmodell och nytt syfte att tja¨na pengar p˚a, genom att ko¨pa och sa¨lja an- nonsutrymme p˚a internet, n˚agra av dessa bolag var Google, Xxxxxxxxxxx.xxx och XxxxxXxxxx.xxx[12]. M˚anga hemsidor och f¨oretag utnyttjar denna annonsverk- samhet f¨or att finansiera sin egen. Genom att erbjuda inneh˚all p˚a sin hemsida skapar de trafik till den, trafiken genererar i sin tur inta¨kter genom att annonser visas p˚a hemsidan.
Tack vare att tillg˚angen till internet okat med fler uppkopplade enheter som mobiltelefoner, smart-TV och surfplattor har a¨ven exponeringen mot annons- marknaden p˚a internet ¨okat. Den o¨kade exponeringen mot marknaden har re- sulterat i en m˚angdubbelt tillv¨axt sedan starten, bara de senaste ˚aren har den globala annonsmarknaden dubblerats fr˚an att omsa¨tta 104 miljarder dollar 2012 till 197 miljarder 2016[14].
Den stora ¨okningen av kapital p˚a annonsmarknaden har gjort att resurser omfo¨rdelats fr˚an andra kanaler, dar ett tydligt exempel p˚a denna omfo¨rdelning
˚aterfinns i tidnings- och TV-branschen. TV-branschen har kraftigt minskat sina int¨akter fr˚an reklam och kompletterat verksamheten med streaming p˚a inter- net medan tidningsbranschens int¨akter har allokerats fr˚an den fysiska tidningen till annonsint¨akter p˚a internettidningen, vilket har a¨ndrat hela branschernas int¨aktsmodell och verksamhet [29]. Denna revolution inom branscherna skulle enligt nationalekonomen Xxxxxxxxxx defineras som “gale of creative destruc- tion” [15].
8.1.1 Typer av annonsering
Marknaden fungerar genom fo¨rsa¨ljning av annonsutrymme. Annonserna utfor- mas p˚a olika s¨att beroende p˚a annonso¨rens preferenser och vilken produkt de betalat f¨or. Inom industrin f¨or annonsering p˚a internet delas annons-typerna upp i fyra olika kategorier, vilka a¨r fo¨ljande:
1. Search advertising, som uppkommer vid so¨kningar p˚a sidor.
2. Display advertising, som p˚aminner om vanliga tidningsannonser. Fo¨rkommer ofta p˚a internetbaserade tidningar.
3. Classified listings, som p˚aminner om radannonser.
4. Internet e − mail, som a¨r annonser via e-mail.
8.2 Avgr¨ansning
Som n¨amnt ovan kan annonser sa¨ljas p˚a olika sa¨tt och marknaderna ser an- norlunda ut. Da¨rf¨or avgr¨ansas prissa¨ttningsmodellen till att behandla display advertising, vilket ¨ar den typ av annonser Wiget Media anva¨nder.
8.3 M¨aklare p˚a internet
Fo¨r att marknaden mellan annonso¨rer och annonsplatser ska fungera kra¨vs en ma¨klare som kan ma¨kla trafiken dem emellan. Ma¨klarens uppgift a¨r att medla trafiken p˚a b¨asta s¨att. Detta inneba¨r att annonserna visas fo¨r ra¨tt individer fo¨r att o¨ka sannolikheten att annonsen a¨r relevant och da¨rigenom o¨ka sannolikheten fo¨r ett ko¨p.
8.4 Generell int¨aktsmodell
Fo¨retagen som agerar ma¨klare p˚a marknaden beho¨ver generera pengar fo¨r att overleva. Hur f¨oretagen va¨ljer att g¨ora detta skiljer sig n˚agot men i detta avsnitt kommer ¨overgripande och generella metoder att ta¨ckas.
Ma¨klarna tar betalt av annons¨orer efter hur m˚anga “impressions” annonsen f˚ar. Med “impresison” menar man hur m˚anga g˚anger annonsen blivit ha¨mtad. Med andra ord hur m˚anga g˚anger annonsen har blivit bega¨rd fr˚an en server till en anv¨andares dator. “Impressions” ra¨knar d¨armed inte antalet klick annonsen f˚ar. F¨or att sa¨kerst¨alla att antalet “impressions” inte manipuleras av “robotar” och annan bedr¨ageriverksamhet har en internationell o¨vervakare kallad Internet Architechture Board satt upp ett ramverk fo¨r bera¨kningen av de.[18]. Den inter- na enheten betalningen sker i kallas “cost per mille” (CPM). Enheten definieras som kostnad per tusende impression.
Ma¨klarna tillhandah˚aller inte annonsutrymmet sja¨lva utan beho¨ver ko¨pa in annonsplatser. Avtalen skiljer sig bitvis men m¨aklarna betalar en fast avgift fo¨r att m¨akla trafiken till hemsidan. De tar sedan betalt av annonso¨rerna i CPM, int¨akterna fr˚an annons¨orerna kan antingen m¨aklaren helt beh˚alla sja¨lv eller dela med hemsidan f¨or annonsplatsen[30]. Uppgiften blir sedan att hitta ra¨tt annons till ra¨tt plats.
8.5 Digitala annonser
I avsnitt 8.1 n¨amns en av de vanligaste metoderna fo¨r att va¨lja ra¨tt annons till ra¨tt annonsplats. D¨ar man utg˚ar ifr˚an s¨okord hos anva¨ndaren fo¨r att anpas- sa annonsen. I denna metod antar man att personen i fr˚aga a¨r intresserad av det denne s¨oker p˚a. Detta anvands fra¨mst av bolag med stora so¨kmotorer som Google och Yahoo! [12].
Figur 8: Digitala annonser
En annan metod m¨aklare anva¨nder sig av a¨r att man l˚ater annonso¨rerna sja¨lva best¨amma vilka anva¨ndare som ska se deras annonser. Da¨r annonso¨rerna anger parametrar som hemsida, enhet (mobil, stationa¨r dator), operativsystem med mera. M¨aklarna anva¨nder sedan deras interna system fo¨r att avgo¨ra vilken annons som visas. N¨ar en bega¨ran om att en annons ska visas listas annonso¨rer
i det interna systemet efter hur va¨l deras preferenser o¨verenssta¨mmer med
anv¨andaren[30]. N¨ar de ra¨tta annonso¨rerna listats va¨ljer ma¨klaren annonso¨ren som a¨r beredd att betala.
8.6 Marknadsekonomi
En av grundf¨orutsa¨ttningarna for prissa¨ttning a¨r att marknaden fo¨r annonse- ring a¨r n˚agorlunda fri. Det betyder att prissa¨ttningen p˚a annonser fo¨ljer de fo¨ruts¨attningar som r˚ader i en marknadsekonomi [31]. I en marknadsekonomi avg¨ors priset p˚a en produkt, i det ha¨r fallet en annons, av utbud och efterfr˚agan. I en ¨oppen marknad interagerar k¨opare och sa¨ljare d¨ar ett pris sa¨tts p˚a den niv˚a da¨r ko¨pare och s¨aljare mo¨ts [31]. Eftersom marknaden fo¨r annonsering mer eller mindre a¨r datoriserad finns det anledning att anta att marknaden a¨r relativt ef- fektiv. Det skulle inneb¨ara att en godtycklig annons vid en godtycklig tidpunkt reflekterar det h¨ogsta pris som en annonso¨r kan ta¨nka sig att betala. Detta fo¨ruts¨atter att det inte r˚ader n˚agon form av ineffektivitet i marknaden, som till exempel att vissa annons¨orer kan fo¨rhandla med icke-prisbaserade medel. Om exempelvis en annons¨or kan erbjuda sig att ko¨pa flera annonser samtidigt mot en rabatt skulle det betyda att det finns ineffektivitet i systemet eftersom att varje annonstillfa¨lle inte kommer att vara korrekt prissatt.
Det a¨r da¨rfo¨r viktigt att prissa¨ttningsmodellen om mo¨jligt inte tar ha¨nsyn till liknande fo¨rhandlingsmedel. Fo¨r att marknaden fo¨r annonser ska kunna an- ses vara effektiv m˚aste varje annons reflektera det ho¨gsta pris som erbjuds. Sa¨ljaren kommer av naturliga sk¨al att prioritera sin egen fortsatta verksamhet
och v¨ardera den till ett premium, detta ar ha¨nfo¨rligt till prospect − theory som ha¨vdar att s¨akerhet va¨rderas ho¨gre an vad det borde go¨ra [32]. Fo¨r sa¨ljaren be- tyder det att aff¨arer som beskrevs xxxx, da¨r en sto¨rre ma¨ngd fo¨rsa¨ljning utlovas mot en m¨angdrabatt a¨r mer attraktiv eftersom att fo¨retag generellt inte sysslar med optimering, utan str¨avar efter att o¨verleva. Fo¨r kunden r˚ader den motsatta situationen. Kunden vet f¨ormodligen att denne kommer att vara intresserad av att annonsera ¨aven n¨asta m˚anad. Xxxxx mo¨jligheten att i fo¨rva¨g veta vad det kommer att kosta, eller kanske rent av boka in det redan nu till rabatt, kommer kunden att f¨oredra det sa¨kra avtalet. Eftersom b˚ade kund och sa¨ljare inte a¨r intresserade av en effektiv priss¨attning finns det all anledning att tro at mark- naden p˚a kort sikt inte ¨ar effektiv. Daremot p˚a l˚ang sikt och aggregerad niv˚a kan den antas vara effektiv. Detta eftersom att o¨ver tid kommer de enskilda ineffektiviteterna att ta ut varandra eftersom man kan anta att kunderna och sa¨ljarna kommer att ha ungefa¨r lika stor fo¨rhandlingskraft.
8.7 Priss¨attningsteori
Fo¨r att utforma priss¨attningsstrategier fo¨r ma¨klare p˚a internet kra¨vs en ge- nomg˚ang av grundl¨aggande men ocks˚a mer utvecklade prissa¨ttningsstrategier over lag. Dels f¨or att f¨orst˚a de system som anv¨ands, men ocks˚a f¨or att f˚a en
overgripande bild av vilka olika modeller som idag existerar fo¨r prissa¨ttning av tja¨nster och produkter.
Som producent eller s¨aljare g¨aller det att anpassa utbudet mot efterfr˚agan, samtidigt som man maximerar sin egen vinst[31]. F¨or att go¨ra detta a¨r det viktigt att veta hur den egna organisationen ¨ar uppbyggd, vilken typ av mark- nad man agerar p˚a samt vilka kunderna ¨ar. Fo¨r att uppn˚a de egna m˚alen a¨r prissa¨ttningen en vital del. Prissa¨ttning kan go¨ras p˚a m˚anga olika sa¨tt och det finns ingen riktig mall att f¨olja. Da¨rfor a¨r det viktigt fo¨r fo¨retagen att utva¨rdera b˚ade den egna organisationen, men ocks˚a marknaden da¨r man agerar fo¨r att kunna utforma en priss¨attningsstrategi. Nedan f¨oljer tre utg˚angspunkter som kan vara av stor nytta vid utformning av en prissa¨ttningsmodell fo¨r fo¨retag som agerar p˚a internet. Fr˚agorna man b¨or stalla sig och utg˚a fr˚an a¨r fo¨ljande [19]:
• Vilka faktorer kan organisationer ta betalt fo¨r?
• Hur kan man uppt¨acka dessa faktorer vid olika typer av service?
• Hur mycket kan man ta betalt?
Fo¨r organisationen ga¨ller det att utva¨rdera de egna kostnaderna och da¨refter sa¨tta ett pris. De fasta kostnaderna beskrivs av service som kra¨vs inom den egna organisationen (underh˚all av system, utrustning, personalkostnader), ut- vecklingskostnader, marginalkostnader f¨or att skicka och spara data samt mar- ginalkostnaden fo¨r fler anva¨ndare [21].
Genom att unders¨oka vilken servicetyp som fo¨retaget erbjuder a¨r det ta¨nkt att man ska kunna definiera problemen mellan servicetyp och prissa¨ttningsmodell. Man kan d˚a identifiera h˚allbara prissa¨ttningsstrategier som tar den tekniska komplexiteten av service i beaktning. Inom detta omr˚ade klassificeras tv˚a kate- gorier, best-effort och QoS (Quality of Service) [19].
Det sista steget ¨ar att definiera ett resonabelt pris utifr˚an fasta kostnader samt den service man erbjuder kunden. I de allra flesta fall besta¨ms dock priset av utbud och efterfr˚agan, men ocks˚a av konkurrens (prispress) fr˚an liknande fo¨retag. D¨arfo¨r a¨r det viktigt att allokera resurserna inom fo¨retaget p˚a ett op- timalt s¨att fo¨r att kunna mo¨ta konkurrens [19].
8.8 Grundl¨aggande priss¨attningsmodeller
8.8.1 Platt priss¨attning
Xxxxx priss¨attning var en av de fo¨rsta prissa¨ttningsmodellerna som uppkom p˚a internet [19]. Platt priss¨attning betyder att man tar ut ett pris eller en avgift C fr˚an kunden, d¨ar exempelvis storleken p˚a C besta¨ms av tiden. Kunder med sam- ma m¨angd tidsanv¨andning betalar d˚a lika mycket. Intuitivt kan man ta¨nka sig att platt priss¨attning a¨r en enkel modell sett ur ett prissa¨ttningsperspektiv, samt att den ¨ar enkel att implementera d˚a den inte a¨r beroende av komplexa system. Vidare stimulerar den h¨ar prissa¨ttninsstrategin na¨tanva¨ndandet d˚a ma¨ngden data en anv¨andare anva¨nder inte prissa¨tts, utan tiden som kunden anva¨nder fo¨retagens tj¨anster. Dock medfo¨r den o¨kade trafiken fo¨r fo¨retagen att optimal resursallokering inte kan uppn˚as, vilket illustreras i bilden nedan.
Figur 9: Plattprissa¨ttning
∫
c
I figur 9 visas priset f¨or anva¨ndaren, p, p˚a y-axeln och anva¨ndning p˚a x- axeln. Efterfr˚agekurvan ges av D(p), c st˚ar fo¨r kostnaden per tidsenhet per anv¨andare. Fr˚an figur 8 kan man utla¨sa att anva¨ndare inte har n˚agra incita- ment att minska anv¨andningen. En nackdel fo¨r fo¨retagen som sker vid platt prissa¨ttning a¨r att fo¨r¨andringen i efterfr˚agan skiftas fr˚an D(c) till D(0) d˚a mar- ginalkostnaden f¨or konsumenten ¨ar 0 [19]. I och med detta blir utebliven inkomst
fo¨r foretagen, 9.
(D(c) D(0))dp , vilket motsvaras av den skuggade arean i figur
−
0
Med hj¨alp av ovanst˚aende kan man diskutera fo¨r att platt prissa¨ttning inte
ar en prissa¨ttningsmodell som fo¨retag avser att anva¨nda d˚a den inte a¨r op-
timal. Dock kan platt priss¨attning vara en referenspunkt eller en del av en prissa¨ttningsstrategi f¨or fo¨retag som vill garantera inta¨kter som ta¨cker de fasta kostnaderna.
8.8.2 Priss¨attning efter anv¨andning
Att priss¨atta efter konsumenters anva¨ndning a¨r ett annat tillva¨gag˚angssa¨tt att prissa¨tta tja¨nster. I det har fallet besta¨ms kundens slutliga pris av konsumerad data och priset p˚a denna, som beskrivs enligt fo¨ljande: P = p * v, da¨r p beskriver priset per enhet anv¨and resurs och v fo¨r volymen.
8.8.3 Priss¨attning efter belastning
Fo¨r att undvika att f˚a for ho¨g belastning under vissa tidpunkter kan man prissa¨tta efter antalet anv¨andare, vilket inneba¨r att ju sto¨rre efterfr˚agan a¨r p˚a att komma ˚at en tj¨anst, desto ho¨gre pris m˚aste konsumenten betala fo¨r att anv¨anda tja¨nsten vid det tillfa¨llet (en sorts dynamisk prissa¨ttning). Det kra¨ver mer komplexa system med uppdatering i realtid fo¨r att korrigera pris efter ef- terfr˚agan.
Av de grundl¨aggande modellerna a¨r priss¨attning efter belastning p˚a systemet det mest allokeringseffektiva alternativet av de tre ovan na¨mnda modellerna. Men bara f¨or att man hittat den mest allokeringseffektiva alternativet betyder det inte att man utesluter andra alternativ, exempelvis kan det finnas situationer da¨r en kombination eller tvarfunktionell prissa¨ttning a¨r att fo¨redra [19].
8.9 Dynamisk priss¨attning
Dynamisk prissa¨ttning a¨r ingen ny priss¨attningsstrategi men har blivit allt vanli- gare i och med framv¨axten av internet. I denna rapport definieras strategin som variation i pris efter faktorer som tid, efterfr˚agan, konsumenter och produk- ter. Internet har underl¨attat insamlande av information hos konsumenter och da¨rmed o¨kat mo¨jligheter att f¨orutsp˚a efterfr˚agan, utbud och beteende[27]. Det- ta har gjort att f¨oretag som agerar p˚a dessa marknader kan anpassa priset mer effektivt och maximera vinsten. Strategin f¨orekommer ofta bland akto¨rer som sa¨ljer tja¨nster som resor, hotellboende och distribution av varor men a¨ven bland
fo¨rs¨aljning av varor som elektronik och bilar. En i raden av nya akto¨rer med den- na strategi ¨ar exempelvis U¨ ber [17]. U¨ ber a¨r en sam˚aknings service som fungerar likt en taxitj¨anst. Fo¨retagets prissa¨ttning inneba¨r att de anpassar priset efter efterfr˚agan och utbud. N¨ar efterfr˚agan p˚a tja¨nsten a¨r stor o¨kar priset. Priset
okar med en multipel efter hur stor efterfr˚agan a¨r likt belastnings prissa¨ttning. Tanken ¨ar att prissa¨ttningen ska motverka en ho¨g efterfr˚agan samt uppmunt- ra fler f¨orare att k¨ora och da¨rmed ¨oka utbudet. Detta fo¨r att uppn˚a U¨ bers m˚al som f¨oretag; tja¨nsten ska alltid vara tillga¨nglig oavsett tid p˚a dygn eller dag[28].
Denna strategi ¨ar en av flera olika strategier inom dynamisk prissa¨ttning. I av- snittet 8.9 presenteras olika typer av dynamiska prissa¨ttningsstrategier p˚a olika marknader. Strategierna kan delas upp i olika segment da¨r antingen fo¨retaget eller kunder avgo¨r priset[20].
8.9.1 Annonserad priss¨attning
Modellen bygger p˚a att priset s¨atts efter kunder, fra¨mst med avseende p˚a deras beteende p˚a marknaden. Detta inneb¨ar att fo¨retagen sa¨nker eller ho¨jer priset beroende p˚a hur frekvent produkter efterso¨ks. Priset anpassas a¨ven efter kon- kurrenter och f¨oretagen uppdaterar sina priser mot konkurrenters p˚a en daglig basis [20]. Modellen har blivit viktig eftersom tillga¨ngligheten till fo¨retagens priser har ¨okat med olika ja¨mf¨orelsesajter som xxxxxxxx.xx och xxxxxxxxxxx.xxx. Prissa¨ttningsstrategin fo¨rekommer framst inom elektronik-branschen da¨r pro- dukter a¨r homogena och la¨tta att ja¨mfo¨ra.
8.9.2 Auktionsbaserad priss¨attning
En auktionsbaserad priss¨attningsmodell inneba¨r att kunder la¨gger bud p˚a varor som s¨aljs. Modellen fungerar som en vanlig auktionsmarknad da¨r det ho¨gsta budet blir priset p˚a varan. V¨arderingen av varan sker i olika takt beroende p˚a marknad d¨ar vanligt fo¨rekommande marknader a¨r auktionsfo¨rsa¨ljning av konst med en l˚angsam v¨arderingstakt eller borsmarknaden da¨r varor va¨rderas varje minut (n¨ar b¨orsen a¨r o¨ppen). Modellen a¨r effektiv och underla¨ttar prissa¨ttning fo¨r fo¨retag eftersom marknaden go¨r det automatiskt ˚at dem. Nackdelen a¨r att man inte kan styra ¨over slutva¨rdering utan fo¨rlustaffa¨rer kan ske om man inte sa¨tter ett utropspris.
8.9.3 Kvantitet priss¨attning
Kvantitetsmodellen utg˚ar ifr˚an ett pris per enhet men slutpriset per enhet avgo¨rs efter hur stor kvantitet som efterfr˚agas och ko¨ps. Detta motiverar kunder att ko¨pa st¨orre kvantiteter och go¨r att foretag med denna modell kan minska sin ATP (Average Total Cost). Detta ¨ar framforallt fo¨rdelaktigt fo¨r fo¨retag med en l˚ag marginalkostnad f¨or varan och kostnaden inte avgo¨rs av volym.
8.10 Utbud och efterfr˚agan p˚a marknaden under ett dygn
Genom att unders¨oka utbudet och efterfr˚agan kan man identifiera faktorer som ar viktiga att ta ha¨nsyn till vid priss¨attning. I figur 10 illustreras antalet im- pressions under ett helt dygn fr˚an fo¨retaget Wiget Media. I denna marknad blir impressions efterfr˚agan p˚a att se en annons. Man kan tydligt konstatera att an- talet tittare varierar kraftigt med tiden med en topp mellan kl 18-21. Det finns flera alternativ f¨or att hantera en varierande efterfr˚agan. Detta tas upp i avsnitt 8.11.
Figur 10: Plot p˚a efterfr˚agan
Vid unders¨okning av ma¨klarnas utbud m˚aste man go¨ra tv˚a antaganden. Fo¨r det f¨orsta a¨r utbudet annonsplatser och inte annonso¨rer som vill marknadsfo¨ra sig d¨ar. Man kan anta att det finns tillra¨ckligt m˚anga annonso¨rer fo¨r att fylla alla annonsplatser samtidigt vid en given tidpunkt. Fo¨r det andra antas utbudet av annonsplatser vara konstant ¨over ett dygn. Det vill sa¨ga att ma¨klarna inte har n˚agra m¨ojligheter att snabbt minska eller o¨ka utbudet under en dag. Detta ar ett rimligt antagande eftersom m¨aklarna alltid sta¨ller sina annonsplatser till f¨orfogande samt att ko¨pa in en stor ma¨ngd nya annonsplatser p˚a en dag inte ¨ar rimligt. Dessutom finns det ingen anledning fo¨r ma¨klarna att sa¨ga upp annonsplatser f¨or att anpassa en variation i efterfr˚agan under en dag. Med dessa antaganden i ryggen kan man n¨armare utreda utseendet p˚a utbudskurvan. Det troligaste a¨r att utbudet ¨ar konstant under en period av ett dygn och da¨rfo¨r blir det sv˚art f¨or m¨aklarna att p˚averka priset eller efterfr˚agan genom fo¨ra¨ndringar i utbud.
8.11 M¨ojliga metoder fo¨r att mo¨ta ¨andringar i efterfr˚agan
Eftersom efterfr˚agan p˚a f¨oretagets annonser fluktuerar o¨ver tid a¨r en prissa¨ttningsmodell som kan hantera detta av yttersta vikt. En dynamisk prissa¨ttningsmodell a¨r modeller anpassade efter skiftningar i antingen utbud eller efterfr˚agan, da¨rfo¨r
blir det naturligt att applicera n˚agon av modellerna inom det avsnittet p˚a ma¨klarnas prissa¨ttningsstrategi. I detta avsnitt kommer marknader med lik- nande f¨oruts¨attningar p˚a efterfr˚agan att presenteras.
8.11.1 Surge-priss¨attning (U¨ bers priss¨attningsmodell)
Genom en surge-priss¨attningsmodell, som a¨r en typ av annonserad prissa¨ttningsmodell, har U¨ ber p˚a ett framg˚angsrikt s¨att lyckats mo¨ta den ¨okande efterfr˚agan p˚a tax-
ibilar som uppst˚ar vid vissa tidpunkter p˚a dygnet. D˚a efterfr˚agan fluktuerar mycket samtidigt som utbudet av f¨orare varierar kra¨vs en prissa¨ttningsmodell som a¨r anpassad till detta. Det har U¨ ber lo¨st genom att o¨ka priset fo¨r kunden
na¨r det a¨r h¨og efterfr˚agan inom ett specifikt geografiskt omr˚ade, vilket resulterar i att fler f¨orare dras till omr˚adet [26]. Resultatet av detta blir att kunden kan ta del av U¨ bers service d˚a utbudet av bilar kan mo¨ta efterfr˚agan, samtidigt som det blir en effektiv allokering f¨or f¨orarna d˚a endast de som tycker att priset a¨r ra¨tt
va¨ljer att erbjuda kunden service i form av transport [25]. En o¨kning av priset inneba¨r dock att en del kunder va¨ljer alternativa transportmedel eller va¨ntar till att priset ˚aterg˚ar till det normala. Da¨rfo¨r ¨okar inte antalet ko¨rningar lika mycket dem potentiellt sett skulle kunna g¨ora sett till efterfr˚agan som finns. Skillnaden mellan dessa illustreras i figur 11, d¨ar den bl˚aa linjen a¨r antalet ko¨rningar och
den r¨oda linjen a¨r antalet personer som oppnar U¨ bers app och a¨r potentiella
kunder [25].
Figur 11: Uber prissa¨ttning
Att applicera en priss¨attningsmodell som liknar ovanst˚aende surge-modell skulle f¨or ma¨klare p˚a internet kunna vara ett tillva¨gag˚angssa¨tt att hantera efter- fr˚agan, men ocks˚a f¨or att f˚a ut mer fr˚an annonso¨rerna. Det inneba¨r att ma¨klarna som m¨aklar trafiken p˚a hemsidorna justerar priset efter hur m˚anga annonso¨rer som konkurrerar om samma annonsplats. Annons¨orerna som vill synas p˚a ba¨sta tid beh¨over d¨arfo¨r betala mer fo¨r att f˚a synas, vilket vid ho¨gre priser minskar antalet annonso¨rer som a¨r villiga att betala.
Om en m¨aklare p˚a internet skulle vilja utforma en surge-modell fo¨r prissa¨ttningen
skulle de beh¨ova unders¨oka efterfr˚agan p˚a annonser samtidigt som de tar in da- ta ang˚aende de som befinner sig p˚a hemsidorna vid de givna tidpunkterna fo¨r att kunna rikta annonserna. Priss¨attningen skulle vara lik den U¨ ber tilla¨mpar,
men med andra variabler som best¨ammer priset. Exempelvis har man ett fast utbud av annonsplatser eftersom man bara kan visa en annons ˚at g˚angen p˚a given yta, vilket ¨ar en skillnad mot U¨ ber som kan erbjuda fler bilar vid ho¨gre priser. M¨aklarnas kunder a¨r annonsorerna vilka i sin tur har den ma¨klade trafi- ken p˚a hemsidorna som kunder, vilket g¨or att ma¨klarna m˚aste skapa ett system som tar detta i beaktning. F¨or ma¨klarna finns det inga ˚atga¨rder de kan go¨ra fo¨r att styra trafiken p˚a hemsidorna, det enda de kan styra o¨ver a¨r ma¨ngden annonso¨rer som vill annonsera p˚a deras annonsplatser d˚a de genom systemet kan styra priset efter efterfr˚agan.
Den presenterade metoden kommer skilja sig n˚agorlunda fr˚an U¨ bers prissa¨ttningsmodell.
Med st¨orsta sannolikhet kommer den inte vara lika effektiv eftersom ma¨klarna inte kan kontrollera utbud och efterfr˚agan p˚a samma sa¨tt som U¨ ber.
8.11.2 Auktionsbaserad priss¨attning med begr¨ansade resurser
Inom m˚anga omr˚aden f¨oresl˚as den auktionsbaserade prissa¨ttningsmodellen som en effektiv metod f¨or att mo¨ta ¨andringar i efterfr˚agan. Inom delning av be- gra¨nsade resurser som till exempelvis n¨atverkstja¨nster a¨r denna lo¨sning effektiv[23]. I och med att resurserna ¨ar begra¨nsade kan fo¨retaget inte utfo¨ra ˚atga¨rder fo¨r att oka utbudet efter efterfr˚agan. Da¨rfo¨r blir priset och efterfr˚agan de tv˚a variabler som styr allokeringen av resurser inom denna prissa¨ttningsmodell. Genom att l˚ata buden styra priset anpassas det direkt efter storleken p˚a efterfr˚agan. En kontinuerlig v¨ardering av en vara kommer resultera i ett pris som ligger na¨ra betalningsviljan hos de som budar och d¨armed reflektera va¨rdet p˚a varan. Pro- blem uppst˚ar om efterfr˚agan ¨ar v¨aldigt l˚ag, detta leder till att va¨rderingen inte blir lika kontinuerlig som ¨onskas samt att priset p˚a produkten kan sjunka na¨ra noll[23]. F¨oretagen kan va¨lja att ˚atga¨rda detta genom att sa¨tta ett reservations- pris p˚a auktionen eller helt l˚ata efterfr˚agan styra priset och acceptera priser da¨r f¨oretaget go¨r fo¨rlust [24]. Auktionen m˚aste ¨aven ske under n˚agon form av monopolistiska f¨orh˚allanden da¨r saljaren ensam har ra¨tt till varan de sa¨ljer[22].
Fo¨r en ma¨klare p˚a internet a¨r denna prissa¨ttningsstrategi va¨l anpassad till
deras verksamhet. Ma¨klaren tillhandah˚aller ett begra¨nsat annonsutrymme fo¨r annonso¨rer att annonsera p˚a. Det konstanta utbudet av annonsplats skulle da¨rf¨or motsvara de begra¨nsade resurserna. Medan annonso¨rerna ses som budar- na som v¨aljer att buda p˚a annonsplatserna. Den annonso¨ren som budar ho¨gst blir den vars inneh˚all visas p˚a annonsplatsen. Tillskillnad fr˚an en vanlig mark- nad f˚ar k¨oparna ra¨ttighet att visa sitt inneh˚all fo¨r anva¨ndare som i detta fall f˚ar anses vara det annons¨orerna konsumerar. Genom att l˚ata buden styra vilken annonso¨r som visas kommer priset f¨or dessa annonser att p˚averkas efter hur m˚anga som vill agera p˚a marknaden samt hur m˚anga konsumenter av annonser som finns tillg¨angliga. Da¨rfo¨r f˚ar ma¨klarna en bra anpassad prissa¨ttningsmodell som anpassas efter efterfr˚agan p˚a ett naturligt sa¨tt. Da¨r ma¨klarna dels inte beh¨over l¨agga ner resurser p˚a att ta fram en algoritm som ska prognostisera priset samt att de kan bortse fr˚an problemet na¨r efterfr˚agan a¨r l˚ag och priset na¨ra noll. Anledningen till att de ha o¨verseende med pris na¨ra noll a¨r fo¨r att ma¨klarna har ett fast pris kopplat till annonsplatsen och da¨rfo¨r inga externa kostnader associerade med att f˚a ett underpris d˚a exponeringstiden redan a¨r
betald. Det blir viktigare f¨or ma¨klarna att skapa va¨rde under dessa timmar fo¨r annonso¨rer snarare a¨n att reglera prisniv˚an. En prisniv˚a som ligger o¨ver an- nonso¨rernas betalningsvilja kommer resultera i helt uteblivna inta¨kter och en sto¨rre fo¨rlust.
Genom denna modell kan man tack vare den dynamiska marknaden hitta ra¨tt prisniv˚aer utan sto¨rre kostnader och sa¨kersta¨lla en effektiv resursallokering.
9 Diskussion
Vid val av prissattningsmodell beho¨ver man som ma¨klare ta ha¨nsyn till flerta- let faktorer. Den kraftiga variationen i efterfr˚agan p˚a daglig basis inneba¨r att man m˚aste hitta ett effektivt s¨att att prissa¨tta sin produkt som tar ha¨nsyn till dessa sv¨angningar. I rapporten har flertalet modeller redovisats som potentiella prissa¨ttningsstrategier. Da¨remot a¨r inte alla modeller aktuella fo¨r prissa¨ttning fo¨r ma¨klare d˚a de inte tar hansyn till den skiftande efterfr˚agan under en dag. Da¨rf¨or kan den fasta prissa¨ttningsmodellen uteslutas som strategi. Detta go¨r att resterande modeller anpassade efter anva¨ndning, belastning och dynamisk prissa¨ttning kvarst˚ar. Alla tre har sina f¨or och nackdelar och den modellen som ar b¨ast beh¨over a¨ven fungera va¨l med maklarnas konstanta utbud i form av an- nonsplatser. I och med att priset blir den enda faktorn som kan hantera denna form av marknadsmodell beh¨ovs en prissa¨ttningsstrategi med en fo¨rm˚aga att kontinuerligt anpassa priset efter efterfr˚agan p˚a ett effektivt och snabbt sa¨tt, d˚a skiftningar i efterfr˚agan sker i realtid.
Den priss¨attningsstrategi som a¨r mest till¨ampbar p˚a skiftande efterfr˚agan ar en dynamisk priss¨attning. Den dynamiska prissattningen kan delas upp i tre olika omr˚aden annonserad, auktionsbaserad och kvantitet prissa¨ttning
9.1 Annonserad priss¨attning
Den annonserad priss¨attningen har fo¨rdelen att fo¨retaget sja¨lva kan sa¨tta priset p˚a sina produkter. Med ett val anpassat pris kan de s¨akersta¨lla en rimlig niv˚a da¨r fo¨retaget inte go¨r f¨orluster p˚a sina produkter samtidigt som de kan justera priset under perioder av h¨og efterfr˚agan. Ett bra exempel p˚a en effektiv annonserad prissa¨ttningsmodell ¨ar U¨ bers surge-prissattning da¨r man p˚a kort tid kan a¨ndra prissa¨ttningen p˚a sina tj¨anster fo¨r att anpassa sig efter a¨ndring i efterfr˚agan eller utbud av bilar. Till skillnad fr˚an m¨aklare har U¨ ber en sto¨rre mo¨jlighet att p˚averka detta, eftersom att ett ¨okat pris b˚ade o¨kar utbudet och sa¨nker efter- fr˚agan f˚ar priss¨attningen p˚a deras marknad sto¨rre slagkraft. Eftersom ma¨klare endast kan p˚averka efterfr˚agan kan man ifr˚agasa¨tta prissa¨ttningsmodellens ef- fektivitet i j¨amfo¨relse med marknaden f¨or U¨ ber. Modellen kommer sannolikt fungera p˚a m¨aklarnas marknad men risken a¨r relativt stor fo¨r fel prissa¨ttning och uteblivna aff¨arer. I och med att kostnaden fo¨r att ma¨kla trafiken endast avgors av hur lange m¨aklaren betalat for rattigheten innebar det att man bo¨r efterstra¨va en full bela¨ggningsgrad p˚a annonsplatserna. Da¨rfo¨r ger ett pris na¨ra noll inte en negativ int¨akt och marknaden borde p˚a egen hand sa¨tta pris p˚a annonserna. Detta g˚ar naturligtvis att imitera med en surge-prissa¨ttning som U¨ ber till¨ampar, men risken fo¨r en snedvriden prissa¨ttning existerar fortfarande.
9.2 Auktionsbaserad priss¨attning
Fo¨rdelen med auktionsbaserad prissa¨ttning ar att det a¨r en effektiv metod fo¨r att m¨ota a¨ndringar i efterfr˚agan. D˚a ma¨klarna va¨ljer det ho¨gsta budet fr˚an kunden blir det en effektiv resursallokering eftersom den kund som va¨rderat annonsplatsen h¨ogst f˚ar den samtidigt som det inneba¨r att ma¨klarna tja¨nar mer pengar. Nackdelen med auktionsbaserad priss¨attning a¨r att ma¨klarna sja¨lva inte kan best¨amma o¨ver slutpriset, vilket go¨r att det finns en risk att man go¨r en f¨orlustaff¨ar. Det a¨r mo¨jligt att f¨orso¨ka undvika detta genom att sa¨tta ett
reservationspris, vilket inneb¨ar att man som ma¨klare inte sa¨ljer annonsplatsen om man inte f˚ar tillr¨ackligt bra betalt. Eftersom marginalkostnaden fo¨r att ma¨kla extra annonser a¨r noll inneba¨r det att priset som annonsen auktioneras fo¨r sa¨ljs. Reservationspris a¨r inget m¨aklare p˚a internet ska applicera d˚a kvantiteten av s˚alda annonser har stor betydelse samt att man inte kommer hitta en ko¨pare som vill betala mer a¨n den som budat ho¨gst.
9.3 Kvantitet priss¨attning
Den kvantitativa priss¨attningsstrategin ¨ar inte tilla¨mpbar fo¨r ma¨klare d˚a man praktiskt taget ger en rabatt till klienter som vill ko¨pa mer. Den ha¨r typen av priss¨attning ¨ar mer effektiv inom vissa omr˚aden ¨an andra. Fo¨r ma¨klare a¨r det som redan n¨amnt en metod som inte skall tilla¨mpas d˚a man har ett be- gra¨nsat utbud av annonsplatser. Att d˚a ge en rabatt na¨r det a¨r konkurrens om annonsplatserna skulle generera ett sa¨mre resultat.
10 Slutsats
Valet av priss¨attningsmodell st˚ar mellan den annonserade prissa¨ttningen med surge-prissa¨ttning eller den auktionsbaserade prissa¨ttningsmodellen. I och med att marknaden i sig ¨ar effektiv faller valet p˚a den modellen med den sto¨rsta mo¨jligheten att anpassa priset efter marknaden. Trots surge-prissa¨ttningens ef- fektivitet blir a¨nd˚a den auktionsbaserade modellen det naturliga valet. Den auktionsbaserade modellen har en bra f¨orm˚aga att anpassa sig d˚a marknaden ensamt styr priset. Modellen kommer aldrig utesluta ko¨p na¨r det finns en ef- terfr˚agan. Da¨rf¨or anses denna modell vara den mest effektiva fo¨r ma¨klarnas marknad och den som i slut¨andan genererar sto¨rst inta¨kter.
Referenser
[1] Xxxxxx Xxxx, Elements of Regression Analysis. July 2015.
[2] Bozdogan. H, Model Selection and Xxxxxx’x Information Criterion (AIC): The General Theory and Its Analytical Extensions. Psychometrika, 52 , 345–370, 1987.
[3] Burnham. K. P., A. D. R, Model selection and multimodel inference Pectical Information-Theoretic approach, 2nd ed..
[4] Frost. J, Regression analysis: How do I interpret r-squared and asses the goodness-of-fit?
[5] XXXX.XXX. Effect size (es)
[6] Xxxxxx. P, Rule of thumb on magnitudes of effect size
[7] XxxxXxxx.xxx, What is hypothesis testing?. April 2016
[8] Xxxxxxxxx.xxxxxxx.xxx, F distribution. April 2016
[9] Xxxxx Xxxxxxxx, Xxxxx Xxxxxxxx
xxxx://xxxxxxxx.xxxxxx.xxx.xx/xxxxxxxx/xxxxxxxxxxxxxxxxxxxx0000xxx.xxx
[10] Xxxxxx Xxxxxxx Econometrics for dummies June 2013
[11] Xxxxxxx X. Xxxx and Xxxxxx X. Xxxxxx, Just A Click Away: Advertising on the Internet Massachussetts: Xxxxx and Xxxxx, 2001
[12] Wallstreet Journal
xxxx://xxx.xxx.xxx/xxxxxxxx/XX000000000000000000
[13] xxx.xx.xx
xxxx://xxx.xxx.xx.xx/ April 2016
[14] Xxxxxxxx.xxx
xxxx://xxx.xxxxxxxx.xxx/xxxxxxxxxx/000000/xxxxxx-xxxxxxxxxxx-xxxxxxxx- worldwide/
[15] Schumpeter. Xxxxxx, Kapitalismus, Sozialismus und Demokratie 1942 (Tys- ka)
[16] More on multicollinearity
xxxx://xxxxxxx.xxxx.xxx/ rramanat/MoreonMC.pdf April 2016
[17] xxxx://xx.xxxxxxxxxxxxxxx.xxx/xxxx-xxxxx-xxxxxxx-xx-xxx-xxxxx-xxx-0000-00?xxXXXXxX
April 2016
[18] xxxx://xxx.xxx.xxx/xxxxx/xxxx/XXxxxxxxxxxxxxxx.xxx
[19] Internet Resource Pricing Model xxxx://xxxxxxxx.xxxxxxxx.xxx.xxxxx.xxx.xxx.xx/xxxxxx/xxx/000/xxx April 2016
[20] Xxxxxx, P. K., and Xxxxxxx X. Kopalle. Dynamic Pricing on the Internet: Importance and Implications for Consumer Behavior. International Journal of Electronic Commerce 5.3 2001: 63–83.
[21] Cumputer Network and ISDN Systems
xxxx://xxx.xxxxxxxxxxxxx.xxx.xxxxx.xxx.xxx.xx/xxxxxxx/xxxxxxx/xxx/0000000000000000
[22] Xxxxx, X. X., Xxxxxxxxx, X. F Optimal Auctions. The American Economic Review, 71(3). 381–392. 1981
[23] Xxxxx X. et al. Auctions for network sharing resources Februari 1997
[24] Xxxxx-Xxx Xxx och Xxxxxxxx X. Xxxxxxxxx Stabilizing Markets via a Novel Auction Based Pricing Mechanism for Short-term Contracts for Network Services
[25] The effect of U¨ ber’s Surge Pricing
xxxx://xxx.xxxxxxxxx.xxx/xx-xxxxxxx/xxxxxxx/0000/00/xxxxxxxxxxxxxxxxxxxxxxxxxx.xxx
April 2016
[26] Harvard Business review: Uber’s “Price Gouging” Is the Future of Business xxxxx://xxx.xxx/0000/00/xxxxx-xxxxx-xxxxxxx-xx-xxx-xxxxxx-xx-xxxxxxxx/ April 2016
[27] Xxxxx, X. E-tailers can peg prices depending on who’s buying San Xxxx Xxxxxxx News, September 24, 2000, 1F
[28] Xxxx.xxx Maj 2016
[29] xxxx://xxx.xxxxxx.xx/xxxxxxx/xxxxxxxx/0000/00/00/xxxxxxxx-xxxxxxxxxxxxxx-x-xxxxxxxxxxx
Maj 2016
[30] Intervju Wiget Media (Opublicerad ka¨lla) April 2016
[31] P. Krugman och X. Xxxxx Economics 2013 Third Edition
[32] xxxx://xxx.xxxxxxxxxxxx.xxx/xxxxx/x/xxxxxxxxxxxxxx.xxx Maj 2016
11 Appendix
11.1 Resultat fr˚an regression med alla kovariat
Estimate | Std.Error | Eta.sq | p.value | |
(Intercept) | -0.3529 | 0.0689 | 0.0121 | 0.0000 |
Viewers | 0.0001 | 0.0000 | 0.0496 | 0.0000 |
CAT | 0.0015 | 0.0413 | 0.0000 | 0.9710 |
CDE | -0.0252 | 0.0261 | 0.0003 | 0.3343 |
CDK | -0.2633 | 0.0347 | 0.0117 | 0.0000 |
CES | -0.7438 | 0.0378 | 0.1491 | 0.0000 |
CFR | -0.1051 | 0.0317 | 0.0042 | 0.0009 |
CIT | -0.1759 | 0.0341 | 0.0098 | 0.0000 |
PFMobile | 0.3093 | 0.0278 | 0.0670 | 0.0000 |
OSAndroid | -0.1876 | 0.0221 | 0.0308 | 0.0000 |
OSIpad | -0.4195 | 0.0318 | 0.0818 | 0.0000 |
OSIphone | -0.3337 | 0.0283 | 0.0553 | 0.0000 |
OSMac | -0.0665 | 0.0156 | 0.0088 | 0.0000 |
OSUnix | -0.1583 | 0.0137 | 0.0249 | 0.0000 |
OSWindows | -0.0444 | 0.0133 | 0.0068 | 0.0008 |
OSWindows8 | -0.0477 | 0.0140 | 0.0061 | 0.0007 |
OSWindowsVista | -0.1677 | 0.0192 | 0.0185 | 0.0000 |
OSWindowsXP | -0.1498 | 0.0160 | 0.0127 | 0.0000 |
catAppsandExtensions | -0.1773 | 0.0210 | 0.0382 | 0.0000 |
‘catDownloadSites,AdultContent‘ | -0.2580 | 0.0251 | 0.0011 | 0.0000 |
‘catDownloadSites,TVandMovies‘ | -0.3856 | 0.0273 | 0.0391 | 0.0000 |
catExchangeTier2 | -0.3902 | 0.0192 | 0.1494 | 0.0000 |
catFileHosting | -0.3300 | 0.0169 | 0.1531 | 0.0000 |
catImageHosting | -0.3856 | 0.0373 | 0.0165 | 0.0000 |
‘catImageHosting,AdultContent‘ | -0.3950 | 0.0259 | 0.0053 | 0.0000 |
catLinkShortener | -0.1666 | 0.0170 | 0.0009 | 0.0000 |
catOther | -0.1292 | 0.0161 | 0.0307 | 0.0000 |
catSportStreaming | -0.2504 | 0.0268 | 0.0228 | 0.0000 |
‘catSport,SportStreaming‘ | -0.4228 | 0.0218 | 0.0117 | 0.0000 |
catTVandMovies | -0.3200 | 0.0273 | 0.0650 | 0.0000 |
‘catTVandMovies,FileHosting‘ | -0.3465 | 0.0197 | 0.1239 | 0.0000 |
‘catTVandMovies,Sport‘ | -0.4201 | 0.0232 | 0.0116 | 0.0000 |
‘catTVandMovies,Sport,FileHosting,SportStreaming‘ | -0.9081 | 0.0288 | 0.1045 | 0.0000 |
‘catTVandMovies,Sport,SportStreaming‘ | -0.4167 | 0.0232 | 0.0528 | 0.0000 |
TimeInter1 | -0.0783 | 0.0127 | 0.0133 | 0.0000 |
TimeInter2 | -0.0213 | 0.0125 | 0.0015 | 0.0887 |
TimeInter3 | -0.0143 | 0.0094 | 0.0013 | 0.1261 |
log(Viewers) | 0.1685 | 0.0127 | 0.0898 | 0.0000 |
Viewers.sqr | -0.0000 | 0.0000 | 0.0133 | 0.0000 |
11.2 Resultat fr˚an regression utan CAT
Estimate | Std.Error | Eta.sq | p.value | |
(Intercept) | -0.3524 | 0.0685 | 0.0127 | 0.0000 |
Viewers | 0.0001 | 0.0000 | 0.0498 | 0.0000 |
CDE | -0.0260 | 0.0238 | 0.0006 | 0.2731 |
CDK | -0.2641 | 0.0322 | 0.0148 | 0.0000 |
CES | -0.7447 | 0.0352 | 0.2318 | 0.0000 |
CFR | -0.1060 | 0.0288 | 0.0081 | 0.0002 |
CIT | -0.1768 | 0.0311 | 0.0173 | 0.0000 |
PFMobile | 0.3093 | 0.0277 | 0.0672 | 0.0000 |
OSAndroid | -0.1876 | 0.0221 | 0.0308 | 0.0000 |
OSIpad | -0.4195 | 0.0318 | 0.0818 | 0.0000 |
OSIphone | -0.3337 | 0.0282 | 0.0553 | 0.0000 |
OSMac | -0.0665 | 0.0156 | 0.0088 | 0.0000 |
OSUnix | -0.1583 | 0.0137 | 0.0249 | 0.0000 |
OSWindows | -0.0444 | 0.0133 | 0.0068 | 0.0008 |
OSWindows8 | -0.0476 | 0.0140 | 0.0061 | 0.0007 |
OSWindowsVista | -0.1677 | 0.0192 | 0.0185 | 0.0000 |
OSWindowsXP | -0.1498 | 0.0159 | 0.0127 | 0.0000 |
catAppsandExtensions | -0.1773 | 0.0209 | 0.0384 | 0.0000 |
‘catDownloadSites,AdultContent‘ | -0.2581 | 0.0251 | 0.0011 | 0.0000 |
‘catDownloadSites,TVandMovies‘ | -0.3853 | 0.0246 | 0.0408 | 0.0000 |
catExchangeTier2 | -0.3902 | 0.0192 | 0.1494 | 0.0000 |
catFileHosting | -0.3300 | 0.0169 | 0.1532 | 0.0000 |
catImageHosting | -0.3856 | 0.0373 | 0.0165 | 0.0000 |
‘catImageHosting,AdultContent‘ | -0.3950 | 0.0259 | 0.0053 | 0.0000 |
catLinkShortener | -0.1666 | 0.0170 | 0.0009 | 0.0000 |
catOther | -0.1292 | 0.0161 | 0.0307 | 0.0000 |
catSportStreaming | -0.2504 | 0.0268 | 0.0228 | 0.0000 |
‘catSport,SportStreaming‘ | -0.4228 | 0.0218 | 0.0117 | 0.0000 |
catTVandMovies | -0.3199 | 0.0270 | 0.0654 | 0.0000 |
‘catTVandMovies,FileHosting‘ | -0.3466 | 0.0190 | 0.1268 | 0.0000 |
‘catTVandMovies,Sport‘ | -0.4202 | 0.0232 | 0.0116 | 0.0000 |
‘catTVandMovies,Sport,FileHosting,SportStreaming‘ | -0.9081 | 0.0288 | 0.1046 | 0.0000 |
‘catTVandMovies,Sport,SportStreaming‘ | -0.4167 | 0.0231 | 0.0529 | 0.0000 |
TimeInter1 | -0.0783 | 0.0127 | 0.0133 | 0.0000 |
TimeInter2 | -0.0213 | 0.0124 | 0.0015 | 0.0873 |
TimeInter3 | -0.0143 | 0.0093 | 0.0013 | 0.1250 |
log(Viewers) | 0.1685 | 0.0127 | 0.0914 | 0.0000 |
Viewers.sqr | -0.0000 | 0.0000 | 0.0134 | 0.0000 |
11.3 Resultat fr˚an regression utan CAT och catLinkShor- tener
Estimate | Std.Error | Eta.sq | p.value | |
(Intercept) | -0.3561 | 0.0684 | 0.0129 | 0.0000 |
Viewers | 0.0001 | 0.0000 | 0.0496 | 0.0000 |
CDE | -0.0263 | 0.0237 | 0.0006 | 0.2680 |
CDK | -0.2626 | 0.0321 | 0.0146 | 0.0000 |
CES | -0.7448 | 0.0352 | 0.2317 | 0.0000 |
CFR | -0.1066 | 0.0288 | 0.0082 | 0.0002 |
CIT | -0.1762 | 0.0311 | 0.0172 | 0.0000 |
PFMobile | 0.3094 | 0.0277 | 0.0671 | 0.0000 |
OSAndroid | -0.1872 | 0.0221 | 0.0307 | 0.0000 |
OSIpad | -0.4190 | 0.0318 | 0.0816 | 0.0000 |
OSIphone | -0.3333 | 0.0282 | 0.0552 | 0.0000 |
OSMac | -0.0659 | 0.0156 | 0.0087 | 0.0000 |
OSUnix | -0.1580 | 0.0136 | 0.0247 | 0.0000 |
OSWindows | -0.0437 | 0.0133 | 0.0066 | 0.0010 |
OSWindows8 | -0.0470 | 0.0140 | 0.0059 | 0.0008 |
OSWindowsVista | -0.1673 | 0.0192 | 0.0184 | 0.0000 |
OSWindowsXP | -0.1492 | 0.0159 | 0.0126 | 0.0000 |
catAppsandExtensions | -0.1755 | 0.0208 | 0.0377 | 0.0000 |
‘catDownloadSites,AdultContent‘ | -0.2562 | 0.0251 | 0.0011 | 0.0000 |
‘catDownloadSites,TVandMovies‘ | -0.3838 | 0.0246 | 0.0405 | 0.0000 |
catExchangeTier2 | -0.3887 | 0.0192 | 0.1487 | 0.0000 |
catFileHosting | -0.3284 | 0.0169 | 0.1524 | 0.0000 |
catImageHosting | -0.3838 | 0.0372 | 0.0164 | 0.0000 |
‘catImageHosting,AdultContent‘ | -0.3929 | 0.0258 | 0.0052 | 0.0000 |
catOther | -0.1273 | 0.0160 | 0.0300 | 0.0000 |
catSportStreaming | -0.2487 | 0.0268 | 0.0225 | 0.0000 |
‘catSport,SportStreaming‘ | -0.4211 | 0.0217 | 0.0116 | 0.0000 |
catTVandMovies | -0.3183 | 0.0270 | 0.0648 | 0.0000 |
‘catTVandMovies,FileHosting‘ | -0.3449 | 0.0189 | 0.1260 | 0.0000 |
‘catTVandMovies,Sport‘ | -0.4185 | 0.0231 | 0.0115 | 0.0000 |
‘catTVandMovies,Sport,FileHosting,SportStreaming‘ | -0.9061 | 0.0287 | 0.1041 | 0.0000 |
‘catTVandMovies,Sport,SportStreaming‘ | -0.4151 | 0.0231 | 0.0525 | 0.0000 |
TimeInter1 | -0.0783 | 0.0127 | 0.0133 | 0.0000 |
TimeInter2 | -0.0223 | 0.0124 | 0.0017 | 0.0720 |
TimeInter3 | -0.0142 | 0.0093 | 0.0012 | 0.1272 |
log(Viewers) | 0.1688 | 0.0127 | 0.0916 | 0.0000 |
Viewers.sqr | -0.0000 | 0.0000 | 0.0133 | 0.0000 |
11.4 Resultat fr˚an regression utan CAT, catLinkShorte- ner och CDE
11.5 Resultat fr˚an regression utan CAT, catLinkShorte- ner, CDK och catDownloadSitesAdultContent
Estimate | Std.Error | Eta.sq | p.value | |
(Intercept) | -0.3692 | 0.0667 | 0.0143 | 0.0000 |
Viewers | 0.0001 | 0.0000 | 0.0510 | 0.0000 |
CDK | -0.2357 | 0.0204 | 0.0151 | 0.0000 |
CES | -0.7211 | 0.0257 | 0.4083 | 0.0000 |
CFR | -0.0798 | 0.0138 | 0.0247 | 0.0000 |
CIT | -0.1486 | 0.0168 | 0.0332 | 0.0000 |
PFMobile | 0.3159 | 0.0262 | 0.0727 | 0.0000 |
OSAndroid | -0.1884 | 0.0220 | 0.0311 | 0.0000 |
OSIpad | -0.4255 | 0.0310 | 0.0864 | 0.0000 |
OSIphone | -0.3401 | 0.0272 | 0.0595 | 0.0000 |
OSMac | -0.0668 | 0.0156 | 0.0089 | 0.0000 |
OSUnix | -0.1589 | 0.0136 | 0.0250 | 0.0000 |
OSWindows | -0.0435 | 0.0132 | 0.0065 | 0.0010 |
OSWindows8 | -0.0478 | 0.0139 | 0.0061 | 0.0006 |
OSWindowsVista | -0.1686 | 0.0191 | 0.0187 | 0.0000 |
OSWindowsXP | -0.1498 | 0.0159 | 0.0127 | 0.0000 |
catAppsandExtensions | -0.1724 | 0.0208 | 0.0367 | 0.0000 |
‘catDownloadSites,TVandMovies‘ | -0.3689 | 0.0199 | 0.0405 | 0.0000 |
catExchangeTier2 | -0.3877 | 0.0192 | 0.1482 | 0.0000 |
catFileHosting | -0.3253 | 0.0170 | 0.1509 | 0.0000 |
catImageHosting | -0.3822 | 0.0372 | 0.0162 | 0.0000 |
‘catImageHosting,AdultContent‘ | -0.3918 | 0.0259 | 0.0052 | 0.0000 |
catOther | -0.1255 | 0.0160 | 0.0293 | 0.0000 |
catSportStreaming | -0.2478 | 0.0267 | 0.0223 | 0.0000 |
‘catSport,SportStreaming‘ | -0.4191 | 0.0217 | 0.0115 | 0.0000 |
catTVandMovies | -0.3174 | 0.0272 | 0.0645 | 0.0000 |
‘catTVandMovies,FileHosting‘ | -0.3393 | 0.0188 | 0.1258 | 0.0000 |
‘catTVandMovies,Sport‘ | -0.4167 | 0.0231 | 0.0114 | 0.0000 |
‘catTVandMovies,Sport,FileHosting,SportStreaming‘ | -0.9034 | 0.0286 | 0.1035 | 0.0000 |
‘catTVandMovies,Sport,SportStreaming‘ | -0.4133 | 0.0233 | 0.0520 | 0.0000 |
TimeInter1 | -0.0794 | 0.0126 | 0.0137 | 0.0000 |
TimeInter2 | -0.0225 | 0.0124 | 0.0017 | 0.0701 |
TimeInter3 | -0.0143 | 0.0094 | 0.0012 | 0.1267 |
log(Viewers) | 0.1664 | 0.0124 | 0.0912 | 0.0000 |
Viewers.sqr | -0.0000 | 0.0000 | 0.0138 | 0.0000 |
11.6 Konfidensintervall fo¨r slutgiltiga modellen
lower | upper | |
(Intercept) | -0.5826 | -0.1550 |
Viewers | 0.0001 | 0.0001 |
CDK | -0.3028 | -0.1721 |
CES | -0.8013 | -0.6366 |
CFR | -0.1244 | -0.0362 |
CIT | -0.2036 | -0.0960 |
PFMobile | 0.2313 | 0.3995 |
OSAndroid | -0.2592 | -0.1179 |
OSIpad | -0.5248 | -0.3262 |
OSIphone | -0.4273 | -0.2530 |
OSMac | -0.1168 | -0.0172 |
OSUnix | -0.2025 | -0.1152 |
OSWindows | -0.0863 | -0.0016 |
OSWindows8 | -0.0927 | -0.0033 |
OSWindowsVista | -0.2301 | -0.1075 |
OSWindowsXP | -0.2010 | -0.0992 |
catAppsandExtensions | -0.2408 | -0.1082 |
‘catDownloadSites,AdultContent‘ | -0.3350 | -0.1755 |
‘catDownloadSites,TVandMovies‘ | -0.4346 | -0.3074 |
catExchangeTier2 | -0.4507 | -0.3278 |
catFileHosting | -0.3811 | -0.2729 |
catImageHosting | -0.5037 | -0.2648 |
‘catImageHosting,AdultContent‘ | -0.4770 | -0.3112 |
catOther | -0.1787 | -0.0761 |
catSportStreaming | -0.3350 | -0.1641 |
‘catSport,SportStreaming‘ | -0.4909 | -0.3518 |
catTVandMovies | -0.4062 | -0.2321 |
‘catTVandMovies,FileHosting‘ | -0.4012 | -0.2810 |
‘catTVandMovies,Sport‘ | -0.4929 | -0.3448 |
‘catTVandMovies,Sport,FileHosting,SportStreaming‘ | -0.9972 | -0.8136 |
‘catTVandMovies,Sport,SportStreaming‘ | -0.4899 | -0.3409 |
TimeInter1 | -0.1201 | -0.0392 |
TimeInter2 | -0.0627 | 0.0169 |
TimeInter3 | -0.0446 | 0.0153 |
log(Viewers) | 0.1269 | 0.2066 |
Viewers.sqr | -0.0000 | -0.0000 |
Figurer
1 Homoskedasticitet vs Hetroskedasticitet 17
2 Endogenitet 18
3 Grundmodell 23
4 log-modell 24
5 QQ-plot 27
6 Endogenitetstest Platform 28
7 Endogenitetstest Viewers 29
8 Digitala annonser 40
9 Plattpriss¨attning 42
10 Plot p˚a efterfr˚agan 45
11 Uber priss¨attning 46
Tabeller
1 Breusch-Pagan test 24
2 AIC k¨orningar 25
3 VIF-tabell 26
4 Konf. intervall viewers 30
5 P˚averkningsgrad viewers 30
6 Konf. intervall l¨ander 31
7 P˚averkningsgrad l¨ander 31
8 Konf. intervall plattform 31
9 P˚averkningsgrad plattform 31
10 Konf. intervall OS 32
11 P˚averkningsgrad OS 32
12 Konf. intervall tiden 33
13 P˚averkan tiden 33
14 Konf. intervall kategorier 34
15 P˚averkan kategorier 34
Estimate | Std.Error | Eta.sq | p.value | |
(Intercept) | -0.3688 | 0.0668 | 0.0142 | 0.0000 |
Viewers | 0.0001 | 0.0000 | 0.0510 | 0.0000 |
CDK | -0.2375 | 0.0204 | 0.0153 | 0.0000 |
CES | -0.7190 | 0.0257 | 0.4059 | 0.0000 |
CFR | -0.0803 | 0.0138 | 0.0249 | 0.0000 |
CIT | -0.1498 | 0.0168 | 0.0337 | 0.0000 |
PFMobile | 0.3154 | 0.0263 | 0.0725 | 0.0000 |
OSAndroid | -0.1886 | 0.0221 | 0.0312 | 0.0000 |
OSIpad | -0.4255 | 0.0310 | 0.0865 | 0.0000 |
OSIphone | -0.3401 | 0.0272 | 0.0595 | 0.0000 |
OSMac | -0.0670 | 0.0156 | 0.0090 | 0.0000 |
OSUnix | -0.1588 | 0.0136 | 0.0250 | 0.0000 |
OSWindows | -0.0439 | 0.0132 | 0.0066 | 0.0009 |
OSWindows8 | -0.0480 | 0.0140 | 0.0062 | 0.0006 |
OSWindowsVista | -0.1688 | 0.0191 | 0.0188 | 0.0000 |
OSWindowsXP | -0.1501 | 0.0159 | 0.0127 | 0.0000 |
catAppsandExtensions | -0.1745 | 0.0207 | 0.0374 | 0.0000 |
‘catDownloadSites,AdultContent‘ | -0.2552 | 0.0249 | 0.0011 | 0.0000 |
‘catDownloadSites,TVandMovies‘ | -0.3710 | 0.0199 | 0.0409 | 0.0000 |
catExchangeTier2 | -0.3892 | 0.0192 | 0.1491 | 0.0000 |
catFileHosting | -0.3270 | 0.0169 | 0.1519 | 0.0000 |
catImageHosting | -0.3843 | 0.0373 | 0.0164 | 0.0000 |
‘catImageHosting,AdultContent‘ | -0.3941 | 0.0259 | 0.0052 | 0.0000 |
catOther | -0.1274 | 0.0160 | 0.0300 | 0.0000 |
catSportStreaming | -0.2496 | 0.0267 | 0.0226 | 0.0000 |
‘catSport,SportStreaming‘ | -0.4214 | 0.0217 | 0.0116 | 0.0000 |
catTVandMovies | -0.3192 | 0.0272 | 0.0651 | 0.0000 |
‘catTVandMovies,FileHosting‘ | -0.3411 | 0.0188 | 0.1266 | 0.0000 |
‘catTVandMovies,Sport‘ | -0.4189 | 0.0231 | 0.0115 | 0.0000 |
‘catTVandMovies,Sport,FileHosting,SportStreaming‘ | -0.9054 | 0.0287 | 0.1039 | 0.0000 |
‘catTVandMovies,Sport,SportStreaming‘ | -0.4154 | 0.0233 | 0.0525 | 0.0000 |
TimeInter1 | -0.0796 | 0.0126 | 0.0138 | 0.0000 |
TimeInter2 | -0.0229 | 0.0124 | 0.0017 | 0.0655 |
TimeInter3 | -0.0146 | 0.0094 | 0.0013 | 0.1177 |
log(Viewers) | 0.1667 | 0.0124 | 0.0916 | 0.0000 |
Viewers.sqr | -0.0000 | 0.0000 | 0.0139 | 0.0000 |
ISRN -KTH/MAT/K--16/13--SE