## Quiz 3

- Si consideri il dataset Credit all’interno del package ISLR

library(ISLR)
library(ggplot2)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.0     ✔ readr     2.1.4
## ✔ forcats   1.0.0     ✔ stringr   1.5.0
## ✔ lubridate 1.9.2     ✔ tibble    3.2.0
## ✔ purrr     1.0.1     ✔ tidyr     1.3.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the ]8;;http://conflicted.r-lib.org/conflicted package]8;; to force all conflicts to become errors
data("Credit",package="ISLR")

- Si vuole studiare una possibile relazione tra l’età (Age) e il reddito (Income). Fare una rappresentazione congiunta delle due variabili. Commentare: emerge qualche pattern specifico?

Credit %>%
ggplot(aes(x=Age,y=Income)) + geom_point()

print("Possiamo notare come i punti si distribuiscono in maniera causale senza seguire un pattern specifico, quindi possiamo denotare un assenza di relazione")
## [1] "Possiamo notare come i punti si distribuiscono in maniera causale senza seguire un pattern specifico, quindi possiamo denotare un assenza di relazione"

- Si suppone a questo punto che questa relazione possa essere meglio specificata se si include anche la variabile Ethnicity. Provare a dividere lo scatterplot sulla base della variabile Ethnicity. Cambia qualcosa? Commentare i grafici.

Credit %>%
ggplot(aes(x=Age,y=Income,color=factor(Ethnicity))) + geom_point(alpha=0.7) + theme_minimal()

print("Sicuramente immettendo anche l'etnia possiamo capire meglio la distribuzione delle frequenze. Infatti possiamo notare come i caucasici abbiano un andamento positivo maggiore rispetto le altre etnie. Rimane comunque ancora una distribuzione delle frequenze molto casuale e servirebbe un altra variabile da mettere in gioco per avere un quadro più chiaro")
## [1] "Sicuramente immettendo anche l'etnia possiamo capire meglio la distribuzione delle frequenze. Infatti possiamo notare come i caucasici abbiano un andamento positivo maggiore rispetto le altre etnie. Rimane comunque ancora una distribuzione delle frequenze molto casuale e servirebbe un altra variabile da mettere in gioco per avere un quadro più chiaro"

- Considerando le sole donne invece?

Credit %>%
filter(Gender=="Female") %>%
ggplot(aes(x=Age,y=Income,color=factor(Ethnicity),size=Gender)) + geom_point(alpha=0.7) + theme_minimal()
## Warning: Using size for a discrete variable is not advised.

print("Il grafico in questione con la suddetta distribuzione delle frequenze ci fa capire come ci sia una grossa variazione delle varie etnie riguardante il sesso femminile. Da notare come i caucasici tendano a un andamento più positivo, gli asiatici ad un più negativo e gli afro americani ad uno di stampo più coerente.")
## [1] "Il grafico in questione con la suddetta distribuzione delle frequenze ci fa capire come ci sia una grossa variazione delle varie etnie riguardante il sesso femminile. Da notare come i caucasici tendano a un andamento più positivo, gli asiatici ad un più negativo e gli afro americani ad uno di stampo più coerente."

- Riprendere il grafico di base che rappresentava l’età (Age) e in funione del reddito (Income). Colorare i punti dello scatterplot sulla base della variabile gender. Commentare i risultati

Credit %>%
ggplot(aes(x=Age,y=Income,color=factor(Gender))) + geom_point(alpha=0.7) + theme_minimal()

print("Dallo Scatterplot si evince una distribuzione delle frequenze per gli Income più alti per il genere maschile mentre per il sesso femminile si può notare un andamento di Income verso le porzioni più basse del grafico. Tutto ciò ad indicare che il sesso maschile tende a fatturare di più rispetto al sesso femminile")
## [1] "Dallo Scatterplot si evince una distribuzione delle frequenze per gli Income più alti per il genere maschile mentre per il sesso femminile si può notare un andamento di Income verso le porzioni più basse del grafico. Tutto ciò ad indicare che il sesso maschile tende a fatturare di più rispetto al sesso femminile"