Mål og forberedelser
I disse oppgavene skal du øve på:
- Å lage en regresjonsmodell med en uavhengig variabel.
- Å tolke og fremstille regresjonsresultater.
Oppgavesett 1
I dette oppgavesettet fortsetter vi å jobbe med samme datasett som i Arbeidsbok 5: Bivariat regresjonsanalyse
, som heter EcoData
. Datasettet inneholder blant annet informasjon om stemmeandel til sittende president (inc_vote
) og økonomien i USA.
Først skal vi se på growth
-variabelen, som viser prosentvis endring i GDP/cap for hvert år.
table(EcoData$growth, EcoData$year)
Kjøre regresjonsanalyse
Vi skal kjøre en regresjonsmodell som har inc_vote
som avhengig, og inflation
som uavhengig variabel. inc_vote
har vi allerede definert, men hva betyr inflasjon?
Når vi skal jobbe med data er det alltid viktig at vi forstår hva dataene våre betyr, og hvordan de måles. Om vi ikke forstår dataene våre kan vi jo ikke få noe ut av dem! Nå som vi har fått med oss det kan vi begynne med den nye regresjonsmodellen.
Kjør en bivariat regresjonsanalyse medinc_vote
som avhengig variabel og inflation
som uavhengig variabel. Kall modellen Mod2
Mod2 <- lm()
Mod2 <- lm(inc_vote)
Mod2 <- lm(inc_vote ~)
Mod2 <- lm(inc_vote ~ inflation)
Mod2 <- lm(inc_vote ~ inflation, data = )
Mod2 <- lm(inc_vote ~ inflation, data = EcoData)
Mod2 <- lm(inc_vote ~ inflation, data = EcoData, na.action = "na.exclude")
Nå som vi har en regresjonsmodell kan vi begynne å se på resultatene av denne.
Brukstargazer
for å se resultatene til regresjonsmodellen Mod2
, og svare på quizen nedenfor.
stargazer(Mod2, type = "text")
Plotte resultater fra regresjonsanlyse
Fyll inn koden under slik at du plotterinflation
på x-aksen og inc_vote
på y-aksen som et spredningsplott, og spesifiserer at du skal legge til en regresjonslinje.
EcoData %>%
ggplot(aes()) +
geom_segment(aes(x = inflation, y = inc_vote,
xend = inflation, yend = predik2)) +
theme_classic()
# Spesifiserer hva som skal være på x- og y-aksen i aes()
EcoData %>%
ggplot(aes(inflation, inc_vote)) +
geom_segment(aes(x = inflation, y = inc_vote,
xend = inflation, yend = predik2)) +
theme_classic()
# Legger til geom_point(), som spesifiserer at vi vil ha et spredningsplott
EcoData %>%
ggplot(aes(inflation, inc_vote)) +
geom_point() +
geom_segment(aes(x = inflation, y = inc_vote,
xend = inflation, yend = predik2)) +
theme_classic()
# Legger til geom_smooth(method = "lm", se = FALSE) for å legge til regresjonslinjen
EcoData %>%
ggplot(aes(inflation, inc_vote)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
geom_segment(aes(x = inflation, y = inc_vote,
xend = inflation, yend = predik2)) +
theme_classic()
EcoData %>%
ggplot(aes(inflation, inc_vote)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
geom_segment(aes(x = inflation, y = inc_vote,
xend = inflation, yend = predik2)) +
theme_classic()
Plottet over viser residualene fra regresjonsmodellen. Bruk plottet for å svare på spørsmålene under.