Mål og forberedelser
I dette oppgavesettet skal vi jobbe med å opprette objekter og utføre enkle regneoperasjoner i R. Før du løser dette oppgavesettet vil jeg anbefales det at du jobber deg igjennom arbeidsbok 1.
Du skal lage egne objekter og bruke enkle koder for å finne informasjon om det du har lagret i objektet.
I disse oppgaven skal du øve på:
Hvordan jobbe med data i R
Opprette objekter og legge sammen vha av funksjoner
Finne ut hvilken klasse objekter har
Lære ulike funksjoner for å foreta vanlige statistiske utregninger i R
Oppgavesett 1
Vi begynner med å lage et objekt som består av alle tallene fra 1 til 10. Objektet kaller jeg tall_til_ti
.
tall_til_ti <- 1:10
Nå kan jeg printe innholdet i objektet ved å skrive objektnavnet og deretter kjøre koden.
tall_til_ti
## [1] 1 2 3 4 5 6 7 8 9 10
Her ser jeg at objektet jeg har laget består av tallene fra 1 til 10.
Lag et objekt som består av alle tallene fra 1 til 100. Kall objektettallrekke
.
tallrekke <- 1:100
Nå har du lagd en rekke med tall som heter tallrekke.
Print tallene i objektet du nettopp lagde.tallrekke
Nå ser du at tallrekka består av alle tallene fra 1 til 100. Vi skal bruke dette objektet for å lære oss litt mer om hvordan vi kan regne med R. Før vi går videre skal vi først sjekke klassen på objektet du opprettet.
Finn klassen til objektet tallrekke.class(tallrekke)
Vanlige utregninger i R
De vanligste kodene for å regne i R er mean()
for gjennomsnitt; sd()
for standardavvik; min()
for minimumsverdi; max()
for maksimumsverdi; var()
for varians; median()
for median. Vi kan også bruke koden summary()
for å printe både minimumsverdi, maximumsverdi, median og gjennomsnitt, samt første- og tredje-kvartil til et numerisk objekt (dvs. objekt av klassen numeric, integer eller dbl).
mean()
til å finne gjennomsnittet til objektet tallrekke
.
mean(tallrekke)
median()
til å finne medianen til objektet tallrekke
.
median(tallrekke)
sd()
til å finne standardavviket til objektet tallrekke
.
sd(tallrekke)
Plusse objekter sammen
Lag et objekt som hetertallrekke1
og som består av alle tallene fra 1 til 20.
tallrekke1 <- 1:20
class()
til å finne klassen til objektet tallrekke1
.
class(tallrekke1)
Vi har nå to objekter som begge består av tall. Vi kan plusse dem sammen ved å skrive objektnavnet og +.
Legg sammen objektenetallrekke
og tallrekke1
, lagre resultatet i et nytt objekt som heter tallrekke2
.
tallrekke2 <- tallrekke+tallrekke1
# Du kan legge sammen objekter vha vanlige matematiske tegn +/-. Objekter som består av tall vil R automatisk legge sammen eller trekke fra dersom du skriver objektnavnn + objektnavn.
tallrekke2
.
tallrekke2
mean()
til å finne gjennomsnittet til tallrekke2
.
mean(tallrekke2)
median()
til å finne medianen til tallrekke2
.
median(tallrekke2)
sd()
til å finne standardavviket til tallrekke2
.
sd(tallrekke2)
summary()
til å printe minimums- og maksimumsverdien til tallrekke2
.
summary(tallrekke2)
Oppgavesett 2
Hvor stor andel av verdens befolkning har fått corona-vaksine?
I dette oppgavesettet bygger vi videre på det vi har lært i Oppgavesett 1 og Arbeidsbok 1. Her skal vi jobbe med data som viser hvor stor andel av befolkningen i et land som har fått corona-vaksine og sammenligne land med hverandre.
Her skal vi jobbe med et datasett som tar for seg andelen av befolkningen i ulike land som har fått koronavaksine. Datasettet heter vaksine
og består av 171 observasjoner (land) og fire variabler (country, andel_vaksinerte, bnp_per_cap, eu_member):
country
: landandel_vaksinerte
: prosentandel av befolkningen som er vaksinert mot covid-19bnp_per_cap
: BNP per innbygger målt i 1000$ i 2019eu_member
: yes = landet er EU-medlem, no = landet er ikke EU-medlem
Vi er interessert i andelen vaksinerte.
En fin kode for å få oversikt over datasettet er head()
. Denne koden tar et argument og det er et datasett. Som dette:
head(vaksine)
Koden viser de seks første radene i datasettet. Her ser du at hver observasjonsenhet er et land. Variabelen andel_vaksinerte
viser hvor mange prosent av befolkningen i de respektive landene i datasettet som har fått vaksine. bnp_per_cap
viser brutto nasjonal produkt per capita og variabelen eu_member
er en dikotom variabel som tar verdien “yes” for de landene som er medlem av EU og “no” for de som ikke er det. Koden head()
kommer vi til å bruke mer i senere i arbeidsbøker.
Husk at du kan bruke ?vaksine
for å få en bedre oversikt over datasettet. Da vil informasjon om datasettet komme opp som en hjelpefil.
Vi har et datasett som heter vaksine
og flere kolonner (eller variable). For å hente ut variable fra datasettet må vi skrive navnet på datasettet etterfulgt av $
og deretter kolonnen. Slik som dette:
class(vaksine$country)
## [1] "character"
Koden class()
viser hvilken klasse variabelen har.
andel_vaksinerte
.
class(vaksine$andel_vaksinerte)
bnp_per_cap
.
class(vaksine$bnp_per_cap)
eu_member
.
class(vaksine$eu_member)
mean()
til å finne gjennomsnittet til variabelen andel_vaksinerte
.
mean(vaksine$andel_vaksinerte)
sd()
til å finne standardavviket til variabelen andel_vaksinerte
.
sd(vaksine$andel_vaksinerte)
Med koden summary()
får vi oversikt over minimums- og maksimums-verdier i tillegg til median og gjennomsnitt.
summary()
til å få en oversikt over variabelen andel_vaksinerte
.
summary(vaksine$andel_vaksinerte)