Oppgaver: Introduksjon til R

Navigasjon

Startside

Startside for arbeidsbøkene

Arbeidsbøker

Oppgavesett

Mål og forberedelser

I dette oppgavesettet skal vi jobbe med å opprette objekter og utføre enkle regneoperasjoner i R. Før du løser dette oppgavesettet anbefales det å du jobber deg igjennom Arbeidsbok 1: Introduksjon til R.

I oppgavesettet vil du bedre kjent med å:

Opprette objekter
Finne ut hvilken klasse objekter har
Lære ulike funksjoner for å foreta vanlige statistiske utregninger i R
Hvordan jobbe med data i R
Koder som gir oversikt over datasett
Klasser og variable
Vanlige statistiske utregninger i R

Oppgavesett 1

Lage objekter

Vi begynner med å lage et objekt som består av alle tallene fra 1 til 10. Objektet kalles tall_til_ti.

tall_til_ti <- 1:10

Nå kan vi printe innholdet i objektet ved å skrive objektnavnet og deretter kjøre koden.

tall_til_ti

##  [1]  1  2  3  4  5  6  7  8  9 10

Her ser vi at objektet vi har laget består av tallene fra 1 til 10.

Lag et objekt som består av alle tallene fra 1 til 100. Kall objektet tallrekke.

tallrekke <- 1:100

Nå har du lagd en rekke med tall som heter tallrekke.

Print tallene i objektet du nettopp lagde.

tallrekke

Nå ser du at tallrekka består av alle tallene fra 1 til 100. Vi skal bruke dette objektet for å lære oss litt mer om hvordan vi kan regne med R. Før vi går videre skal vi først sjekke klassen på objektet du opprettet.

Finn klassen til objektet tallrekke.

class(tallrekke)

Vanlige utregninger i R

De vanligste kodene for å regne i R er mean() for gjennomsnitt; sd() for standardavvik; min() for minimumsverdi; max() for maksimumsverdi; var() for varians; median() for median. Vi kan også bruke koden summary() for å printe både minimumsverdi, maximumsverdi, median, gjennomsnitt og klasse på et objekt.

Bruk mean() til å finne gjennomsnittet til objektet tallrekke.

mean(tallrekke)

Bruk median() til å finne medianen til objektet tallrekke.

median(tallrekke)

Bruk sd() til å finne standardavviket til objektet tallrekke.

sd(tallrekke)

Legge sammen objekter

Lag et objekt som heter tallrekke1 og som består av alle tallene fra 1 til 20.

tallrekke1 <- 1:20

Bruk class() til å finne klassen til objektet tallrekke1.

class(tallrekke1)

Vi har nå to objekter som begge består av tall. Vi kan plusse dem sammen ved å skrive objektnavnet og +.

Legg sammen objektene tallrekke og tallrekke1, lagre resultatet i et nytt objekt som heter tallrekke2.

tallrekke2 <- tallrekke+tallrekke1

# Du kan legge sammen objekter vha vanlige matematiske tegn +/-. Objekter som består av tall vil R automatisk legge sammen eller trekke fra dersom du skriver objektnavnn + objektnavn.

Print objektet tallrekke2.

tallrekke2

Bruk mean() til å finne gjennomsnittet til tallrekke2.

mean(tallrekke2)

Bruk median() til å finne medianen til tallrekke2.

median(tallrekke2)

Bruk sd() til å finne standardavviket til tallrekke2.

sd(tallrekke2)

Bruk koden summary() til å printe minimums- og maksimumsverdien til tallrekke2.

summary(tallrekke2)

Oppgavesett 2

Hvor stor andel av verdens befolkning har fått corona-vaksine?

I dette oppgavesettet bygger vi videre på det vi har lært i Oppgavesett 1 og Arbeidsbok 1: Introduksjon til R. Her skal vi jobbe med data som viser hvor stor andel av befolkningen i et land som har fått corona-vaksine og sammenligne land med hverandre.

Her skal vi jobbe med et datasett som tar for seg andelen av befolkningen i ulike land som har fått koronavaksine. Vi er interessert i andelen vaksinerte. Datasettet heter vaksine og består av 171 observasjoner (land) og fire variabler (country, andel_vaksinerte, bnp_per_cap, eu_member):

country: land
andel_vaksinerte: prosentandel av befolkningen som er vaksinert mot covid-19
bnp_per_cap: BNP per innbygger målt i 1000$ i 2019
eu_member: yes = landet er EU-medlem, no = landet er ikke EU-medlem

En fin kode for å få oversikt over datasettet er head(). Denne koden tar et argument og det er et datasett. Som dette:

head(vaksine)

Koden viser de seks første radene i datasettet. Her ser du at hver observasjonsenhet er et land. Variabelen andel_vaksinerte viser hvor mange prosent av befolkningen i de respektive landene i datasettet som har fått vaksine. bnp_per_cap viser brutto nasjonal produkt per capita og variabelen eu_member er en dikotom variabel som tar verdien “yes” for de landene som er medlem av EU og “no” for de som ikke er det. Koden head() kommer vi til å bruke mer i senere i arbeidsbøker.

Husk at du kan bruke ?vaksine for å få en bedre oversikt over datasettet. Da vil informasjon om datasettet komme opp som en hjelpefil.

Vi har et datasett som heter vaksine og flere kolonner (eller variable). For å hente ut variable fra datasettet må vi skrive navnet på datasettet etterfulgt av $ og deretter kolonnen. Slik som dette:

class(vaksine$country)

## [1] "character"

Koden class() viser hvilken klasse variabelen har.

Finn klassen til variabelen andel_vaksinerte.

class(vaksine$andel_vaksinerte)

Finn klassen til variabelen bnp_per_cap.

class(vaksine$bnp_per_cap)

Finn klassen til variabelen eu_member.

class(vaksine$eu_member)

Bruk mean() til å finne gjennomsnittet til variabelen andel_vaksinerte.

mean(vaksine$andel_vaksinerte)

Bruk sd() til å finne standardavviket til variabelen andel_vaksinerte.

sd(vaksine$andel_vaksinerte)

Med koden summary() får vi oversikt over minimums- og maksimums-verdier i tillegg til median og gjennomsnitt.

Bruk summary() til å få en oversikt over variabelen andel_vaksinerte.

summary(vaksine$andel_vaksinerte)

Hvor mange i EU har fått koronavaksine?

Vi skal se nærmere på andelen vaksinerte i EU. Du skal nå bruke et datasett som heter vaksine_1. Dette datasettet inneholder de samme variablene som det forrige datasett, men vi har fjernet alle land som ikke er EU-medlem fra datasettet.

Bruk koden head() for å se de seks første observasjonene i datasettet vaksine_1.

head(vaksine_1)

Bruk mean() til å finne gjennomsnittet av variabelen andel_vaksinerte.

mean(vaksine_1$andel_vaksinerte)