Skip to Tutorial Content

Mål og forberedelser

I dette oppgavesettet skal vi jobbe med å opprette objekter og utføre enkle regneoperasjoner i R. Før du løser dette oppgavesettet vil jeg anbefales det at du jobber deg igjennom arbeidsbok 1.

Du skal lage egne objekter og bruke enkle koder for å finne informasjon om det du har lagret i objektet.

I disse oppgaven skal du øve på:

  • Hvordan jobbe med data i R

  • Opprette objekter og legge sammen vha av funksjoner

  • Finne ut hvilken klasse objekter har

  • Lære ulike funksjoner for å foreta vanlige statistiske utregninger i R

Oppgavesett 1

Vi begynner med å lage et objekt som består av alle tallene fra 1 til 10. Objektet kaller jeg tall_til_ti.

tall_til_ti <- 1:10

Nå kan jeg printe innholdet i objektet ved å skrive objektnavnet og deretter kjøre koden.

tall_til_ti
##  [1]  1  2  3  4  5  6  7  8  9 10

Her ser jeg at objektet jeg har laget består av tallene fra 1 til 10.

Lag et objekt som består av alle tallene fra 1 til 100. Kall objektet tallrekke.
tallrekke <- 1:100

Nå har du lagd en rekke med tall som heter tallrekke.

Print tallene i objektet du nettopp lagde.
tallrekke

Nå ser du at tallrekka består av alle tallene fra 1 til 100. Vi skal bruke dette objektet for å lære oss litt mer om hvordan vi kan regne med R. Før vi går videre skal vi først sjekke klassen på objektet du opprettet.

Finn klassen til objektet tallrekke.
class(tallrekke)

Vanlige utregninger i R

De vanligste kodene for å regne i R er mean() for gjennomsnitt; sd() for standardavvik; min() for minimumsverdi; max() for maksimumsverdi; var() for varians; median() for median. Vi kan også bruke koden summary() for å printe både minimumsverdi, maximumsverdi, median og gjennomsnitt, samt første- og tredje-kvartil til et numerisk objekt (dvs. objekt av klassen numeric, integer eller dbl).

Bruk mean() til å finne gjennomsnittet til objektet tallrekke.
mean(tallrekke)
Bruk median() til å finne medianen til objektet tallrekke.
median(tallrekke)
Bruk sd() til å finne standardavviket til objektet tallrekke.
sd(tallrekke)

Plusse objekter sammen

Lag et objekt som heter tallrekke1 og som består av alle tallene fra 1 til 20.
tallrekke1 <- 1:20
Bruk class() til å finne klassen til objektet tallrekke1.
class(tallrekke1)

Vi har nå to objekter som begge består av tall. Vi kan plusse dem sammen ved å skrive objektnavnet og +.

Legg sammen objektene tallrekke og tallrekke1, lagre resultatet i et nytt objekt som heter tallrekke2.
tallrekke2 <- tallrekke+tallrekke1
# Du kan legge sammen objekter vha vanlige matematiske tegn +/-. Objekter som består av tall vil R automatisk legge sammen eller trekke fra dersom du skriver objektnavnn + objektnavn.
Print objektet tallrekke2.
tallrekke2
Bruk mean() til å finne gjennomsnittet til tallrekke2.
mean(tallrekke2)
Bruk median() til å finne medianen til tallrekke2.
median(tallrekke2)
Bruk sd() til å finne standardavviket til tallrekke2.
sd(tallrekke2)
Bruk koden summary() til å printe minimums- og maksimumsverdien til tallrekke2.
summary(tallrekke2)

Oppgavesett 2

Hvor stor andel av verdens befolkning har fått corona-vaksine?

I dette oppgavesettet bygger vi videre på det vi har lært i Oppgavesett 1 og Arbeidsbok 1. Her skal vi jobbe med data som viser hvor stor andel av befolkningen i et land som har fått corona-vaksine og sammenligne land med hverandre.

Her skal vi jobbe med et datasett som tar for seg andelen av befolkningen i ulike land som har fått koronavaksine. Datasettet heter vaksine og består av 171 observasjoner (land) og fire variabler (country, andel_vaksinerte, bnp_per_cap, eu_member):

  • country: land

  • andel_vaksinerte: prosentandel av befolkningen som er vaksinert mot covid-19

  • bnp_per_cap: BNP per innbygger målt i 1000$ i 2019

  • eu_member: yes = landet er EU-medlem, no = landet er ikke EU-medlem

Vi er interessert i andelen vaksinerte.

En fin kode for å få oversikt over datasettet er head(). Denne koden tar et argument og det er et datasett. Som dette:

head(vaksine)

Koden viser de seks første radene i datasettet. Her ser du at hver observasjonsenhet er et land. Variabelen andel_vaksinerte viser hvor mange prosent av befolkningen i de respektive landene i datasettet som har fått vaksine. bnp_per_cap viser brutto nasjonal produkt per capita og variabelen eu_member er en dikotom variabel som tar verdien “yes” for de landene som er medlem av EU og “no” for de som ikke er det. Koden head() kommer vi til å bruke mer i senere i arbeidsbøker.

Husk at du kan bruke ?vaksine for å få en bedre oversikt over datasettet. Da vil informasjon om datasettet komme opp som en hjelpefil.

Vi har et datasett som heter vaksine og flere kolonner (eller variable). For å hente ut variable fra datasettet må vi skrive navnet på datasettet etterfulgt av $ og deretter kolonnen. Slik som dette:

class(vaksine$country)
## [1] "character"

Koden class() viser hvilken klasse variabelen har.

Finn klassen til variabelen andel_vaksinerte.
class(vaksine$andel_vaksinerte)
Finn klassen til variabelen bnp_per_cap.
class(vaksine$bnp_per_cap)
Finn klassen til variabelen eu_member.
class(vaksine$eu_member)
Bruk mean() til å finne gjennomsnittet til variabelen andel_vaksinerte.
mean(vaksine$andel_vaksinerte)
Bruk sd() til å finne standardavviket til variabelen andel_vaksinerte.
sd(vaksine$andel_vaksinerte)

Med koden summary() får vi oversikt over minimums- og maksimums-verdier i tillegg til median og gjennomsnitt.

Bruk summary() til å få en oversikt over variabelen andel_vaksinerte.
summary(vaksine$andel_vaksinerte)

Hvor mange i EU har fått koronavaksine?

Vi skal se nærmere på andelen vaksinerte i EU. Du skal nå bruke et datasett som heter vaksine_1. Dette datasettet inneholder de samme variablene som det forrige datasett, men vi har fjernet alle land som ikke er EU-medlem fra datasettet.

Bruk koden head() for å se de seks første observasjonene i datasettet vaksine_1.
head(vaksine_1)
Bruk mean() til å finne gjennomsnittet av variabelen andel_vaksinerte.
mean(vaksine_1$andel_vaksinerte)
Bruk sd() til å finne standardavviket til variabelen andel_vaksinerte.
sd(vaksine_1$andel_vaksinerte)
Bruk summary() til å få en oversikt over variabelen andel_vaksinerte.
summary(vaksine_1$andel_vaksinerte)

Oppgavesett 1: Introduksjon til R

Eli Sofie Baltzersen, Louisa Boulaziz, Bjørn Høyland, Eric Nilsen, Lise Rødland

29/01/2024