Skip to Tutorial Content

Mål og forberedelser

I disse oppgavene skal du øve på:

  • Å lage en regresjonsmodell med en uavhengig variabel.
  • Å tolke og fremstille regresjonsresultater.

Oppgavesett 1

I dette oppgavesettet fortsetter vi å jobbe med samme datasett som i Arbeidsbok 5: Bivariat regresjonsanalyse, som heter EcoData. Datasettet inneholder blant annet informasjon om stemmeandel til sittende president (inc_vote) og økonomien i USA.

Først skal vi se på growth-variabelen, som viser prosentvis endring i GDP/cap for hvert år.

Bruk kode for å finne svarene til quizen nedenfor.
table(EcoData$growth, EcoData$year)

Kjøre regresjonsanalyse

Vi skal kjøre en regresjonsmodell som har inc_vote som avhengig, og inflation som uavhengig variabel. inc_vote har vi allerede definert, men hva betyr inflasjon?

Quiz

Når vi skal jobbe med data er det alltid viktig at vi forstår hva dataene våre betyr, og hvordan de måles. Om vi ikke forstår dataene våre kan vi jo ikke få noe ut av dem! Nå som vi har fått med oss det kan vi begynne med den nye regresjonsmodellen.

Kjør en bivariat regresjonsanalyse med inc_vote som avhengig variabel og inflation som uavhengig variabel. Kall modellen Mod2
Mod2 <- lm()
Mod2 <- lm(inc_vote)
Mod2 <- lm(inc_vote ~)
Mod2 <- lm(inc_vote ~ inflation)
Mod2 <- lm(inc_vote ~ inflation, data = )
Mod2 <- lm(inc_vote ~ inflation, data = EcoData)
Mod2 <- lm(inc_vote ~ inflation, data = EcoData, na.action = "na.exclude")

Nå som vi har en regresjonsmodell kan vi begynne å se på resultatene av denne.

Bruk stargazer for å se resultatene til regresjonsmodellen Mod2, og svare på quizen nedenfor.
 stargazer(Mod2, type = "text")
Quiz

Plotte resultater fra regresjonsanlyse

Fyll inn koden under slik at du plotter inflation på x-aksen og inc_vote på y-aksen som et spredningsplott, og spesifiserer at du skal legge til en regresjonslinje.
EcoData %>% 
  ggplot(aes()) +
  geom_segment(aes(x = inflation, y = inc_vote,
                   xend = inflation, yend = predik2)) +
  theme_classic()
# Spesifiserer hva som skal være på x- og y-aksen i aes()
EcoData %>% 
  ggplot(aes(inflation, inc_vote)) +
  geom_segment(aes(x = inflation, y = inc_vote,
                   xend = inflation, yend = predik2)) +
  theme_classic()
# Legger til geom_point(), som spesifiserer at vi vil ha et spredningsplott
EcoData %>% 
  ggplot(aes(inflation, inc_vote)) +
  geom_point() +
  geom_segment(aes(x = inflation, y = inc_vote,
                   xend = inflation, yend = predik2)) +
  theme_classic()
# Legger til geom_smooth(method = "lm", se = FALSE) for å legge til regresjonslinjen
EcoData %>% 
  ggplot(aes(inflation, inc_vote)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) +
  geom_segment(aes(x = inflation, y = inc_vote,
                   xend = inflation, yend = predik2)) +
  theme_classic()
EcoData %>% 
  ggplot(aes(inflation, inc_vote)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) +
  geom_segment(aes(x = inflation, y = inc_vote,
                   xend = inflation, yend = predik2)) +
  theme_classic()
Quiz

Plottet over viser residualene fra regresjonsmodellen. Bruk plottet for å svare på spørsmålene under.

Quiz

Oppgavesett 5: Bivariat regresjonsanalyse

Eli Sofie Baltzersen, Louisa Boulaziz, Bjørn Høyland, Eric Nilsen, Lise Rødland

30/01/2024