Mål og forberedelser
I dette oppgavesettet skal vi jobbe med å opprette objekter og utføre enkle regneoperasjoner i R. Før du løser dette oppgavesettet anbefales det å du jobber deg igjennom Arbeidsbok 1: Introduksjon til R.
I oppgavesettet vil du bedre kjent med å:
Opprette objekter
Finne ut hvilken klasse objekter har
Lære ulike funksjoner for å foreta vanlige statistiske utregninger i R
Hvordan jobbe med data i R
Koder som gir oversikt over datasett
Klasser og variable
Vanlige statistiske utregninger i R
Oppgavesett 1
Lage objekter
Vi begynner med å lage et objekt som består av alle tallene fra 1 til 10. Objektet kalles tall_til_ti
.
tall_til_ti <- 1:10
Nå kan vi printe innholdet i objektet ved å skrive objektnavnet og deretter kjøre koden.
tall_til_ti
## [1] 1 2 3 4 5 6 7 8 9 10
Her ser vi at objektet vi har laget består av tallene fra 1 til 10.
Lag et objekt som består av alle tallene fra 1 til 100. Kall objektettallrekke
.
tallrekke <- 1:100
Nå har du lagd en rekke med tall som heter tallrekke.
Print tallene i objektet du nettopp lagde.tallrekke
Nå ser du at tallrekka består av alle tallene fra 1 til 100. Vi skal bruke dette objektet for å lære oss litt mer om hvordan vi kan regne med R. Før vi går videre skal vi først sjekke klassen på objektet du opprettet.
Finn klassen til objektet tallrekke.class(tallrekke)
Vanlige utregninger i R
De vanligste kodene for å regne i R er mean()
for gjennomsnitt; sd()
for standardavvik; min()
for minimumsverdi; max()
for maksimumsverdi; var()
for varians; median()
for median. Vi kan også bruke koden summary()
for å printe både minimumsverdi, maximumsverdi, median, gjennomsnitt og klasse på et objekt.
Bruk mean()
til å finne gjennomsnittet til objektet tallrekke
.
mean(tallrekke)
Bruk median()
til å finne medianen til objektet tallrekke
.
median(tallrekke)
Bruk sd()
til å finne standardavviket til objektet tallrekke
.
sd(tallrekke)
Legge sammen objekter
Lag et objekt som hetertallrekke1
og som består av alle tallene fra 1 til 20.
tallrekke1 <- 1:20
class()
til å finne klassen til objektet tallrekke1
.
class(tallrekke1)
Vi har nå to objekter som begge består av tall. Vi kan plusse dem sammen ved å skrive objektnavnet og +.
Legg sammen objektene tallrekke
og tallrekke1
, lagre resultatet i et nytt objekt som heter tallrekke2
.
tallrekke2 <- tallrekke+tallrekke1
# Du kan legge sammen objekter vha vanlige matematiske tegn +/-. Objekter som består av tall vil R automatisk legge sammen eller trekke fra dersom du skriver objektnavnn + objektnavn.
tallrekke2
.
tallrekke2
mean()
til å finne gjennomsnittet til tallrekke2
.
mean(tallrekke2)
median()
til å finne medianen til tallrekke2
.
median(tallrekke2)
sd()
til å finne standardavviket til tallrekke2
.
sd(tallrekke2)
summary()
til å printe minimums- og maksimumsverdien til tallrekke2
.
summary(tallrekke2)
Oppgavesett 2
Hvor stor andel av verdens befolkning har fått corona-vaksine?
I dette oppgavesettet bygger vi videre på det vi har lært i Oppgavesett 1 og Arbeidsbok 1: Introduksjon til R. Her skal vi jobbe med data som viser hvor stor andel av befolkningen i et land som har fått corona-vaksine og sammenligne land med hverandre.
Her skal vi jobbe med et datasett som tar for seg andelen av befolkningen i ulike land som har fått koronavaksine. Vi er interessert i andelen vaksinerte. Datasettet heter vaksine
og består av 171 observasjoner (land) og fire variabler (country, andel_vaksinerte, bnp_per_cap, eu_member):
country
: landandel_vaksinerte
: prosentandel av befolkningen som er vaksinert mot covid-19bnp_per_cap
: BNP per innbygger målt i 1000$ i 2019eu_member
: yes = landet er EU-medlem, no = landet er ikke EU-medlem
En fin kode for å få oversikt over datasettet er head()
. Denne koden tar et argument og det er et datasett. Som dette:
head(vaksine)
Koden viser de seks første radene i datasettet. Her ser du at hver observasjonsenhet er et land. Variabelen andel_vaksinerte
viser hvor mange prosent av befolkningen i de respektive landene i datasettet som har fått vaksine. bnp_per_cap
viser brutto nasjonal produkt per capita og variabelen eu_member
er en dikotom variabel som tar verdien “yes” for de landene som er medlem av EU og “no” for de som ikke er det. Koden head()
kommer vi til å bruke mer i senere i arbeidsbøker.
Husk at du kan bruke ?vaksine
for å få en bedre oversikt over datasettet. Da vil informasjon om datasettet komme opp som en hjelpefil.
Vi har et datasett som heter vaksine
og flere kolonner (eller variable). For å hente ut variable fra datasettet må vi skrive navnet på datasettet etterfulgt av $
og deretter kolonnen. Slik som dette:
class(vaksine$country)
## [1] "character"
Koden class()
viser hvilken klasse variabelen har.
andel_vaksinerte
.
class(vaksine$andel_vaksinerte)
bnp_per_cap
.
class(vaksine$bnp_per_cap)
eu_member
.
class(vaksine$eu_member)
mean()
til å finne gjennomsnittet til variabelen andel_vaksinerte
.
mean(vaksine$andel_vaksinerte)
sd()
til å finne standardavviket til variabelen andel_vaksinerte
.
sd(vaksine$andel_vaksinerte)
Med koden summary()
får vi oversikt over minimums- og maksimums-verdier i tillegg til median og gjennomsnitt.
summary()
til å få en oversikt over variabelen andel_vaksinerte
.
summary(vaksine$andel_vaksinerte)