Cuarteto de Anscombe

#importando los datos
anscombe <- read.csv2("~/BI/exercise1/exercise1/anscombe.csv", stringsAsFactors=TRUE)
str(anscombe)
## 'data.frame':    44 obs. of  3 variables:
##  $ Set: int  1 1 1 1 1 1 1 1 1 1 ...
##  $ X  : int  10 8 13 9 11 14 6 4 12 7 ...
##  $ Y  : num  8.04 6.95 7.58 8.81 8.33 ...
#convierte la primera columna en factor, para que no lo lea como un int
anscombe$Set <- as.factor(anscombe$Set)
str(anscombe)
## 'data.frame':    44 obs. of  3 variables:
##  $ Set: Factor w/ 4 levels "1","2","3","4": 1 1 1 1 1 1 1 1 1 1 ...
##  $ X  : int  10 8 13 9 11 14 6 4 12 7 ...
##  $ Y  : num  8.04 6.95 7.58 8.81 8.33 ...
#dividir en subgrupos
uno <- subset(anscombe, anscombe$Set == 1)
promedioX <- mean(uno$X)
varianzaX <- var(uno$X)
promedioY <- mean(uno$Y)
varianzaY <- var(uno$Y)
correlacion <- cor(uno$X,uno$Y)

SummaryStats <- data.frame(promedioX, promedioY, varianzaX, varianzaY, correlacion)
SummaryStats
##   promedioX promedioY varianzaX varianzaY correlacion
## 1         9  7.500909        11  4.127269   0.8164205
dos <- subset(anscombe, anscombe$Set == 2)
tres <- subset(anscombe, anscombe$Set == 3)
cuatro <- subset(anscombe, anscombe$Set == 4)

Visualización del 1er conjunto

#Importar la Libreria
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
#gplotUno <- ggplot(uno,aes(X,Y))
gplotUno <- ggplot(anscombe,aes(X,Y, color = Set))

#aumento capas
#gplotUno <- gplotUno + geom_point()
gplotUno <- gplotUno + geom_line()


#gplotUno

gplotUno <- gplotUno + geom_smooth(method = lm, se = FALSE) #el 'se' es para mostrar el embudo que encierra a la linea central

gplotUno <- gplotUno + geom_vline(aes(xintercept = promedioX)) #aes significa Aesthetics
#gplotUno

gplotUno <- gplotUno + geom_hline(aes(yintercept = promedioY))
gplotUno
## `geom_smooth()` using formula = 'y ~ x'

Visualización FACETAS``

gplotDos <- ggplot(anscombe,aes(X,Y))

#aumento capas

gplotDos <- gplotDos + geom_point()

gplotDos <- gplotDos + geom_smooth(method = lm, se = FALSE) #el 'se' es para mostrar el embudo que encierra a la linea central

gplotDos <- gplotDos + geom_vline(aes(xintercept = promedioX)) #aes significa Aesthetics

gplotDos <- gplotDos + geom_hline(aes(yintercept = promedioY))


#crear un dataset con todas las variables de todos los grupos y graficar
#Facetas
#gplotUno <- gplotUno + facet_wrap(. ~Set)
gplotDos <- gplotDos + facet_grid(. ~ Set)
gplotDos
## `geom_smooth()` using formula = 'y ~ x'