Estudi poblsció alumnes: - Vam fer una enquesta amb un formulari google i el vam enviar a contactes nostres que són estudiants d’universitat. - Amb aquest conjunt de dades volem arribar a estudiar si diferents factors afecten al rendiment academic. - Ens agradaria respondre si _____. - Dades adecuades?.
Mostreu com heu importat el fitxer i quin nom té l’objecte carregat.
load("ConjuntDeDades.RData")
# Exemple d'importació (modifiqueu segons calgui)
# dades <- read_csv("nom_fitxer.csv")
##dades <- read_csv("ConjuntDeDades.RData")`
PRE-ENTREGA: ##- Quin era el format original (CSV, XLSX, txt…) - PRE-ENTREGA: ## Quin era el format original (CSV, XLSX, txt…) Modificacions previes: Neteja de dades (posar el mateix nom a varies coses amb el mateix significat) Afegir una columna que ens agrupa els estudis (facultat)
# dim(dades)
# glimpse(dades)
Incloeu: - Nombre de files: - Nombre de columnes: - Quina és la unitat d’anàlisi (persona, empresa, producte, mesura…)
Descriviu cada variable del dataset.
| Variable | Tipus | Descripció | Valors possibles / rang |
|---|---|---|---|
| id | numèrica | Identificador numèric de l’estudiant (si n’hi ha) | 1, 2, 3, … |
| edat | numèrica | Edat de l’estudiant | 18–60 (segons dades reals) |
| genere | factor | Gènere amb què s’identifica l’estudiant | per ex. Dona, Home, Altres, Prefereixo no dir-ho |
| facultat | factor | Facultat o àmbit d’estudis de l’estudiant | per ex. Enginyeries, Ciències, Salut, Socials… |
| titulacio | factor | Grau concret que estudia | noms dels graus recollits |
| curs | factor | Curs actual dels estudis | 1r, 2n, 3r, 4t, >4t |
| crèdits_matriculats | numèrica | Nombre de crèdits matriculats aquest curs | 0–? |
| nota_mitjana | numèrica | Nota mitjana aproximada de l’estudiant | 0–10 (o escala utilitzada) |
| hores_estudi_setmana | numèrica | Hores d’estudi a la setmana (fora de classe) | 0–? |
| treballa | factor | Si l’estudiant treballa mentre estudia | Sí / No |
| hores_treball_setmana | numèrica | Hores de feina remunerada a la setmana | 0–? |
| hores_son_diaries | numèrica | Hores de son diàries | 0–24 (en pràctica rang realista 3–12) |
| temps_oci_setmanal | numèrica | Hores dedicades a oci i activitats extraacadèmiques | 0–? |
| satisfaccio_estudis | factor | Grau de satisfacció amb els estudis | escales tipus 1–5, per exemple |
| stress_academic | factor | Percepció de nivell d’estrès relacionat amb els estudis | escales tipus 1–5, per exemple |
| grup_estudis | factor | Categoria d’agrupació dels estudis (variable creada) | Ciències, Enginyeries, Salut, Socials, Humanitats |
# tibble(
# variable = names(dades),
# tipus = sapply(dades, class)
# )
# summary(dades)
Comenteu: - Si hi ha valors perduts. - Hem transformat els valors que estaven en format de rang en un numero aixi si haguessim de fer calculs serien mes precisos.
Incloeu una o dues gràfiques exploratòries.
# Exemple:
# ggplot(dades, aes(x = variable)) + geom_histogram()
Expliqueu: - Si necessitareu dades externes per completar l’anàlisi. - On les podríeu trobar. - Si falten variables per respondre la pregunta inicial.
Incloeu qualsevol altre detall rellevant del procés de preparació de dades.