Om å jobbe i R versus SPSS

SPSS er et mer “lukket” system der de fleste funksjonene kommer innebygd i selve programmet, og brukerne er avhengig av oppdateringer fra IBM for nye funksjoner. Med R kan brukerne installere og bruke “packages” som er laget av forskjellige utviklere, noe som gir større fleksibilitet og muligheter for tilpasning.

R-pakker er en samling av ulike funksjoner, data og dokumentasjon. Man kan også lage egne pakker med ulike funksjoner, for eksempel inkluderer design og farger til figurer (f.eks Daniel laget normentR() pakke).

For eksempel finnes en pakke som kan generere automatiske tabeller i apa-stil som kan lagres direkte i et word-dokument, med R-pakken gtsummary. Det er nyttig når vi sammenligner demografisk/klinisk info mellom grupper med statistiske tester. Det finnes en egen pakke “ggplot2” som har enormt mange funksjoner for å lage alt du kan tenke deg av figurer. Jeg anbefaler å sjekke The R Graph Gallery og from Data to Viz for inspirasjon og tilgjengelig kode for ulike figurer som kan lages i R. Hvis du allerede nå sitter med analyser, anbefaler jeg å sjekke ut Dr Mowinckel sin blogpost om lineær regresjon i R her.

Den største fordelen med R er at det er script-basert. Det gjør at datarens, filtrering, standardisering, analyser og figurer er mye mer “reproducible” sammenlignet SPSS. Det vil også spare deg for mye tid og hodebry. Alt du gjør er skrevet ned i scripts som du lagrer, og du kan gå tilbake til det X måneder senere og se nøyaktig hva som ble gjort. I kurset skal vi bruke R-projects som er en ryddig måte å organisere scripts, data, figurer og tabeller til ulike prosjekter eller artikler.

Man skiller mellom 2 ulike kodestiler, “Base-R” og “tidyverse”, hvor tidyverse-stilen er desidert enklest for tidligere SPSS brukere. Tidyverse er egentlig en stor samling R-pakker som vi kommer til å bruke mye. Tidyverse funksjoner har en mer intuitiv og lettforståelig syntaks, som minner om logikken man bruker i SPSS ved hjelp av menyer og dialogbokser. For eksempel har funksjonene beskrivende navn, som filter(), select(), og mutate(). Hvis du vil lese litt mer om Tidyverse sine funksjoner før kurset anbefaler jeg å sjekke denne siden, men du må ikke ha noen spesifikke forkunnskaper før kurset. HOT TIP: Du trenger ikke kunne alt, bare akkurat nok til kunne å skrive gode prompts til f.eks ChatGPT eller annen AI, som kan gi deg kode tilpasset ditt formål!

R kan brukes til utrolig mye, for eksempel er dette dokumentet laget i R ved hjelp av RMarkdown, og det er også mulig å lage en hjemmeside med R!

Under kommer informasjon om hva vi skal lære på kurset og viktige forberedelser litt lengre ned :)

Hva skal vi lære?

Kurset blir hands-on live-coding, det vil si at vi sammen jobber i R med ulike relevante oppgaver. Jeg forbereder en anonymisert fil av kognitive data fra TOP-studien som vi skal jobbe med.

Tentativ plan for kursdagen:

FØR LUNSJ: FORBEREDE FIL TIL ANALYSER OG FIGURER
R projects, script og import av data

  • Opprette R project med egne mapper for data, scripts, tabeller og figurer
  • Importere spss fil
  • Få oversikt over data

Data wrangling/preprocessing

  • Descriptive statistics
  • Datarens (fjerne umulige skårer)
  • Selektere og filtrere (f.eks eksklusjonskriterier)
  • Endre/lage nye variabler for å lage kognitive domener (Z-skårer)

ETTER LUNSJ: ANALYSER, FIGURER, TABELLER
Statistiske analyser

  • Basics: t-tester, anova, korrelasjon
  • Regresjon med kovariater

Figurer

  • Heatmap
  • Line-plot
  • Raincloud-plot

Tabeller

  • Tabell med sample characteristics
  • Tabell med kognitive data

Vi får se hva vi rekker på dagen, men har som sagt planer om å sette opp mer spesifikke workshops hvor vi kan gå litt mer i detalj på ulike ting.

FORBEREDELSE FØR KURS

Oppdatere eller laste ned R/Rstudio

Det er ingen spesifikke forberedelser annet enn å komme med R/Rstudio installert og oppdatert på selve kursdagen. Før vi har kurset er det derfor supert om dere kan laste ned R og Rstudio lokalt på deres PC/mac laptop. Det er gratis og krever ikke lisens. Installer R/Rstudio via denne lenken: https://posit.co/download/rstudio-desktop/

Hvis du allerede har R/Rstudio, sjekk at du har nyeste versjon, f.eks via help –> check for updates. Du kan også sjekke hvilken versjon du har på denne måten:

# code to check R version
getRversion()
## [1] '4.3.0'

Og Rstudio sjekker du på denne måten:

# code to check Rstudio version
rstudioapi::versionInfo()$version
## [1] '2024.9.1.394'

I motsetning til SPSS er det kontinuerlig oppdateringer av R og Rstudio. Dere må ikke ha nøyaktiv samme versjon som meg, men de fleste pakkene krever minst R versjon 3.6.0+. Hvis noe ikke fungerer kan det være at R, Rstudio og/eller pakken du bruker er utdatert eller ikke kompatibel med versjon. Dette er nyttig informasjon som også må oppgis under metode i artikler hvis du bruker R/Rstudio. Varsle meg før kursdagen hvis du har problemer med nedlasting/oppdatering.

Oppdatere eller installere relevante “packages”

Pakkene må også oppdateres. Det hender seg at funksjoner endrer navn eller funksjonalitet, men det er som regel dokumentert sammen med funksjonen. Du oppdaterer pakker på denne måten:

# code to update packages
update.packages(ask=FALSE)

For å installere en pakke, for eksempel Tidyverse:

# code to install packages
install.packages("tidyverse")

# load the package in a script:
library(tidyverse)

JEG GLEDER MEG TIL Å SE DERE 17. DESEMBER