1. Introducció

Estudi poblsció alumnes: - Vam fer una enquesta amb un formulari google i el vam enviar a contactes nostres que són estudiants d’universitat. - Amb aquest conjunt de dades volem arribar a estudiar si diferents factors afecten al rendiment academic. - Ens agradaria respondre si _____. - Dades adecuades?.

2. Importació de les dades

Mostreu com heu importat el fitxer i quin nom té l’objecte carregat.

load("ConjuntDeDades.RData")
# Exemple d'importació (modifiqueu segons calgui)
# dades <- read_csv("nom_fitxer.csv")
##dades <- read_csv("ConjuntDeDades.RData")`

PRE-ENTREGA: ##- Quin era el format original (CSV, XLSX, txt…) - PRE-ENTREGA: ## Quin era el format original (CSV, XLSX, txt…) Modificacions previes: Neteja de dades (posar el mateix nom a varies coses amb el mateix significat) Afegir una columna que ens agrupa els estudis (facultat)

3. Dimensions del dataset

# dim(dades)
# glimpse(dades)

Incloeu: - Nombre de files: - Nombre de columnes: - Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…)

4. Diccionari de variables

Descriviu cada variable del dataset.

Variable Tipus Descripció Valors possibles / rang
id numèrica Identificador numèric de l’estudiant (si n’hi ha) 1, 2, 3, …
edat numèrica Edat de l’estudiant 18–60 (segons dades reals)
genere factor Gènere amb què s’identifica l’estudiant per ex. Dona, Home, Altres, Prefereixo no dir-ho
facultat factor Facultat o àmbit d’estudis de l’estudiant per ex. Enginyeries, Ciències, Salut, Socials…
titulacio factor Grau concret que estudia noms dels graus recollits
curs factor Curs actual dels estudis 1r, 2n, 3r, 4t, >4t
crèdits_matriculats numèrica Nombre de crèdits matriculats aquest curs 0–?
nota_mitjana numèrica Nota mitjana aproximada de l’estudiant 0–10 (o escala utilitzada)
hores_estudi_setmana numèrica Hores d’estudi a la setmana (fora de classe) 0–?
treballa factor Si l’estudiant treballa mentre estudia Sí / No
hores_treball_setmana numèrica Hores de feina remunerada a la setmana 0–?
hores_son_diaries numèrica Hores de son diàries 0–24 (en pràctica rang realista 3–12)
temps_oci_setmanal numèrica Hores dedicades a oci i activitats extraacadèmiques 0–?
satisfaccio_estudis factor Grau de satisfacció amb els estudis escales tipus 1–5, per exemple
stress_academic factor Percepció de nivell d’estrès relacionat amb els estudis escales tipus 1–5, per exemple
grup_estudis factor Categoria d’agrupació dels estudis (variable creada) Ciències, Enginyeries, Salut, Socials, Humanitats
# tibble(
#   variable = names(dades),
#   tipus = sapply(dades, class)
# )

5. Estadístiques descriptives

# summary(dades)

Comenteu: - Si hi ha valors perduts. - Hem transformat els valors que estaven en format de rang en un numero aixi si haguessim de fer calculs serien mes precisos.

6. Visualització inicial

Incloeu una o dues gràfiques exploratòries.

# Exemple:
# ggplot(dades, aes(x = variable)) + geom_histogram()

7. Variables externes i dades addicionals

Expliqueu: - Si necessitareu dades externes per completar l’anàlisi. - On les podríeu trobar. - Si falten variables per respondre la pregunta inicial.

8. Altres comentaris

Incloeu qualsevol altre detall rellevant del procés de preparació de dades.